期刊文献+

汉语连续语音识别中语音处理和语言处理统合方法的研究 被引量:9

Study on the integration of speech and language processing in Recognition of Chinese Continuous Speech
原文传递
导出
摘要 提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于 CFG语言模型和 Top Down型句法分析器的语言处理过程结合进基于有限状态自动机控制的 One Pass Viterbi语音识别算法中,实现了帧同步的语音语言处理的统合。为完成帧同步句法分析的单词预测和语音识别过程的结合,本文提出了一种类似于Earley法的 TopDown型句法分析方法以及 One Pass Viterbi算法中的有限状态自动机动态展开建立法. 60个音素单位和 8个声调单位的 HMM作为识别用基元模型被用于识别实验,识别结果表明,对于一个识别困难度(Perplexity)为27.3的任务(Task)的识别系统,利用本文提出的方法,10名话者发音的 1070句子的平均识别率达到 94.4%,比利用传统的基于单词确认(Word Spotting)以及从单词串(列)(lattice)进行句法分析的阶层性语音·语言统合方式的识别率提高约8%. This paper presents a method of Chinese continuous speech recognition, which synthesizes speech and language processing with frame-synchronous parsing algorithm. The evolved language processing employs the context free grammar and top down sentence analyzer. The evolved speech processing uses the One Pass Viterbi algorithm based on finite state automaton. In the evaluation experiments, 60 phonemic HMMs and 8 tone HMMs were used. By using the proposed algorithm, we obtained the average sentence recognition rate of 94.4% for 1070 utterances of ten speakers, and an improvement of 8% is obtained in the same task of perplexity 27.3, compared to conventional hierarchical system based on word spotting and lattice parsing algorithm.
出处 《声学学报》 EI CSCD 北大核心 2001年第1期73-78,共6页 Acta Acustica
基金 国家自然科学基金资助项目!(合同号:69871009)
  • 相关文献

参考文献8

  • 1新美康永.音声认识[M].日本共立出版社,1987..
  • 2Zhao L,ICCCPOL'97,1997年,178页
  • 3Zhao L,日本音响学会论文志,1997年,53卷,12期,933页
  • 4Zhao L,IEICE Technical Report SP98 26,1995年,9页
  • 5Zhao L,IEICE TRANS INF SYST ED,1995年,78卷,6期,66页
  • 6Chien L F,IEEE Trans SAP,1993年,1卷,2期,221页
  • 7Lei L,IEICE Technical Report SP90 105,1990年
  • 8新美康永,音声认识,1987年

共引文献2

同被引文献50

引证文献9

二级引证文献25

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部