汉语连续语音识别中语音处理和语言处理统合方法的研究被引量：9

Study on the integration of speech and language processing in Recognition of Chinese Continuous Speech

导出

摘要提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于ＣＦＧ语言模型和ＴｏｐＤｏｗｎ型句法分析器的语言处理过程结合进基于有限状态自动机控制的ＯｎｅＰａｓｓＶｉｔｅｒｂｉ语音识别算法中，实现了帧同步的语音语言处理的统合。为完成帧同步句法分析的单词预测和语音识别过程的结合，本文提出了一种类似于Ｅａｒｌｅｙ法的ＴｏｐＤｏｗｎ型句法分析方法以及ＯｎｅＰａｓｓＶｉｔｅｒｂｉ算法中的有限状态自动机动态展开建立法．６０个音素单位和８个声调单位的ＨＭＭ作为识别用基元模型被用于识别实验，识别结果表明，对于一个识别困难度（Ｐｅｒｐｌｅｘｉｔｙ）为２７．３的任务（Ｔａｓｋ）的识别系统，利用本文提出的方法，１０名话者发音的１０７０句子的平均识别率达到９４．４％，比利用传统的基于单词确认（ＷｏｒｄＳｐｏｔｔｉｎｇ）以及从单词串（列）（ｌａｔｔｉｃｅ）进行句法分析的阶层性语音·语言统合方式的识别率提高约８％． This paper presents a method of Chinese continuous speech recognition, which synthesizes speech and language processing with frame-synchronous parsing algorithm. The evolved language processing employs the context free grammar and top down sentence analyzer. The evolved speech processing uses the One Pass Viterbi algorithm based on finite state automaton. In the evaluation experiments, 60 phonemic HMMs and 8 tone HMMs were used. By using the proposed algorithm, we obtained the average sentence recognition rate of 94.4% for 1070 utterances of ten speakers, and an improvement of 8% is obtained in the same task of perplexity 27.3, compared to conventional hierarchical system based on word spotting and lattice parsing algorithm.

作者赵力邹采荣吴镇扬

机构地区东南大学无线电工程系

出处《声学学报》 EI CSCD 北大核心 2001年第1期73-78,共6页 Acta Acustica

基金国家自然科学基金资助项目!(合同号:69871009)

关键词汉语连续语音识别语音处理语言处理统合 Speech recognition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1新美康永.音声认识[M].日本共立出版社,1987..
2Zhao L，ICCCPOL'97，1997年，178页
3Zhao L，日本音响学会论文志，1997年，53卷，12期，933页
4Zhao L，IEICE Technical Report SP98 26，1995年，9页
5Zhao L，IEICE TRANS INF SYST ED，1995年，78卷，6期，66页
6Chien L F，IEEE Trans SAP，1993年，1卷，2期，221页
7Lei L，IEICE Technical Report SP90 105，1990年
8新美康永，音声认识，1987年

共引文献2

1王吉林,赵力,邹采荣.基于概率DP匹配法的噪声环境下说话人识别方法的研究[J].电声技术,2005,29(8):47-49. 被引量：2
2肖圣兵,赵力,刘海滨,吴镇扬.利用DSP实现的实际环境下语音识别方法[J].电子与信息学报,2003,25(6):847-850.

同被引文献50

1于亭.计算机与古籍整理研究手段现代化[J].古汉语研究,2000(3):66-70. 被引量：19
2林平澜,王仁华.动态HMM及其在说话人识别中的应用[J].信号处理,1993,9(4):250-256. 被引量：1
3吕成国,韩纪庆,王承发.动态时间规正与差别子空间相结合的变异语音识别方法[J].声学学报,2005,30(3):229-234. 被引量：2
4俞铁成.实时语音识别系统及其应用[J].中国科学院院刊,1989,4(1):53-55. 被引量：1
5周农.洗碗机市场机会在哪里？[J].现代家电,2005(18):36-38. 被引量：2
6王成友,汤叔祺,梁甸农,陈辉煌,唐朝京.语音识别中多种特征信息综合利用的方法[J].声学学报,1997,22(2):111-115. 被引量：6
7黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版社,1998..
8Jonathan Foote, An overview of audio information retrieval. Multimedia Systems, 1999; 7(1): 2-11.
9Smoliar S W, Baker J D, Nakayama T, Wilcox L. Multimedia search: An authoring perspective. In: Proceedings of the First International Workshop on Image Databasesand Multimedia Search, 1996; 1:1-8.
10John Makhoul, Francis Kubala et al. Speech and Language Technologies for Audio Indexing and Retrieval. Proceedings of the IEEE, 2000; 88(8): 1338-1353.

引证文献9

1黄启良.汉语方言语音识别系统的构建[J].广西科学院学报,2005,21(3):193-195.
2郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
3韦向峰,张全,熊亮.一种基于语义分析的汉语语音识别纠错方法[J].计算机科学,2006,33(10):152-155. 被引量：2
4赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究[J].声学学报,2001,26(3):259-263. 被引量：3
5赵力,邹采荣,吴镇扬.HMM在说话人识别中的应用[J].电路与系统学报,2001,6(3):51-57. 被引量：10
6赵力.基于偶数帧段输入隐马尔可夫模型的噪声环境下汉语连续语音识别研究[J].声学学报,2002,27(1):59-61. 被引量：1
7王亚冉.基于语音识别技术的洗碗机智能交互控制设计[J].现代信息科技,2017,1(1):86-88. 被引量：1
8黄亚琳,董效杰,张远念,郑灏.基于STM32的语音呼救器[J].中小企业管理与科技,2018,2(16):123-124.
9蒋平,吴振国.声调识别错误的统计分析——语音输入软件测试报告之一[J].语言文字应用,2003(2):22-29. 被引量：4

二级引证文献25

1黄启良.汉语方言语音识别系统的构建[J].广西科学院学报,2005,21(3):193-195.
2邱政权,尹俊勋.针对说话人识别进行的加权小波去噪方法[J].电声技术,2005,29(9):53-56. 被引量：3
3包永强,赵力,邹采荣.采用归一化补偿变换的与文本无关的说话人识别[J].声学学报,2006,31(1):55-60. 被引量：13
4邱政权,尹俊勋.用于说话人辨认的基于重叠子帧的有效KLT[J].微计算机信息,2006,22(08Z):8-10.
5邱政权,尹俊勋.基于说话人识别的GMM/GA算法[J].电声技术,2006,30(8):43-45. 被引量：1
6王书诏,邱天爽.说话人识别研究综述[J].电声技术,2007,31(1):51-55. 被引量：10
7邱政权,尹俊勋.结合重叠子帧的KLT和MMCE的说话人辨认[J].声学技术,2007,26(4):660-663. 被引量：1
8黄浩,朱杰.汉语语音识别中基于区分性权重训练的声调集成方法[J].声学学报,2008,33(1):1-8. 被引量：2
9范小春,邱政权.说话人识别中的HOCOR和改进的MCE[J].科学技术与工程,2008,8(12):3159-3161.
10HUANG Hao ZHU Jie.Tone model integration based on discriminative weight training for Putonghua speech recognition[J].Chinese Journal of Acoustics,2008,27(3):193-202.

1赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的汉语连续语音识别方法[J].电子学报,2000,28(7):67-69. 被引量：5
2周志杰.ADSP2100系列DSP处理器[J].军事通信技术,1993(3):31-39.
3李辉.LTE FDD&CDMA室内分布系统合路改造方案探讨[J].信息通信,2015,28(2):243-244. 被引量：3
4郭希蕊,张涛.2.3GTD-LTE和联通WCDMA系统合路互调干扰问题研究[J].移动通信,2015,39(12):15-20. 被引量：5
5杨海燕.组建高效的客户服务中心[J].电信科学,2000,16(8):20-23. 被引量：7
6Sony、东芝、日立已同意合并中小尺寸面板事业[J].网印工业,2011(9):52-52.
7电路总论[J].电子科技文摘,2002,0(8):21-22.
8曾智洪.一种高效率的声音处理系统[J].无线电,1993(11):28-28.
9赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究[J].声学学报,2001,26(3):259-263. 被引量：3
10章澎欧,阳珉.低速率语音编码器的性能分析[J].南京邮电学院学报,1992,12(3):19-25.

声学学报

2001年第1期

浏览历史

内容加载中请稍等...

汉语连续语音识别中语音处理和语言处理统合方法的研究被引量：9

参考文献8

共引文献2

同被引文献50

引证文献9

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

汉语连续语音识别中语音处理和语言处理统合方法的研究 被引量：9

参考文献8

共引文献2

同被引文献50

引证文献9

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

汉语连续语音识别中语音处理和语言处理统合方法的研究被引量：9