汉语连续语音识别中经典HMM的实验评测被引量：6

Experimental Evaluation of Classical HMM in Mandarin Continuous Speech Recognition

下载PDF

导出

摘要定量地分析与评价经典隐马尔可夫模型（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ，ＨＭＭ）的性能，是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典ＨＭＭ模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合，研究了经典ＨＭＭ模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系；并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的ＴＨＥＥＳＰ系统的识别率相当，所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 In the area of mandarin continuous speech recognition,there has always been an urgent but unaddressed task to quantitatively analyze and evaluate the performance of classical Hidden Markov Model(HMM).A baseline system based on classical HMM is implemented in this paper.The relations between complexity, reliability, ac curacy of HMMs and training data sufficiency,training time,decoding efficiency are studied under various combinations of the two axes, choice of acoustic units and output pdfs form of HMMs.N-Best syllable candidates construction and pruning are analyzed experimentally.The system in this paper shows that the state-of-the-art performance is almost the same as the THEESP system.The experimental results and conclusions in the paper are expected to provide useful reference for fur- ther study of mandarin speech recognition.

作者郝杰李星

机构地区清华大学电子工程系

出处《计算机工程与应用》 CSCD 北大核心 2001年第13期1-4,101,共5页 Computer Engineering and Applications

基金国家863计划基金国家杰出青年科学基金(编号:69625103)资助

关键词汉语连续语音识别经典HMM模型 THEESP系统语音信号处理 mandarin continuous speech recognition,classical HMM,THEESP system

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1王作英.基于段长分布的HMM语音识别模型.第二届全国汉字语音识别会议[M].庐山,1989..
2－.智能机研究动态.第五届全国汉字识别、语音识别与合成系统及自然语言处理系统评测结果[M].,1994,4..
3Wang Zuoying，Chin J Electron，1998年，7卷，1期
4Wang Zuoying，Technical Report，1998年
5Wang Zuoying，Proc the First Int Conference on Multimodal Interface（ICMI'96），1996年，70页
6智能机研究动态，1994年
7Wang Zuoying，Telecommunication Science，1993年，9卷，4期，31页
8Young S J，HTK Version 1.5:User Reference and Programmer Manuals，1993年
9王作英，第二届全国汉字语音识别会议，1989年

共引文献14

1吴及,刘丰,王作英.连续语音识别系统中测度计算的快速算法研究[J].清华大学学报（自然科学版）,1999,39(5):77-80. 被引量：3
2杨浩荣,王作英,陆大.汉语语音识别中的拼音多候选问题[J].电子学报,1999,27(4):58-62. 被引量：4
3吕萍,王作英,陆大金.基于最大似然模型插值的快速说话人自适应算法[J].中文信息学报,2002,16(1):49-53. 被引量：2
4吕萍,王作英,陆大■.基于矩阵线性插值的说话人自适应算法[J].清华大学学报（自然科学版）,2002,42(1):27-29.
5汪俊杰,赵勇,肖熙,王作英.使用SSE技术优化语音识别中的测度计算[J].计算机工程与应用,2002,38(8):85-86.
6乔春雷,吴及,王作英.在汉语语音识别中应用声调信息的研究[J].计算机工程与应用,2002,38(12):51-53. 被引量：5
7郝杰,李星.基于经典隐马尔可夫模型的汉语连续语音识别系统[J].电子与信息学报,2002,24(7):944-947. 被引量：3
8吕萍,吴及,王作英,陆大.连续语音识别中的说话人快速自适应技术[J].清华大学学报（自然科学版）,2002,42(7):977-980. 被引量：4
9余鹏,王作英.语音识别中空间相关性信息的利用[J].电子学报,2002,30(7):964-966. 被引量：1
10欧智坚,王作英.从线性预测HMM到一种新的语音识别的混合模型[J].电子学报,2002,30(9):1313-1316. 被引量：3

同被引文献54

1AbbasH.Hassin Xiang-LongTang Jia-FengLiu WeiZhao.Printed Arabic Character Recognition Using HMM[J].Journal of Computer Science & Technology,2004,19(4):538-543. 被引量：3
2哈力木拉提,阿孜古丽.多字体印刷维吾尔文字符识别系统的研究与开发[J].计算机学报,2004,27(11):1480-1484. 被引量：36
3杜利民,侯自强.汉语语音识别研究面临的一些科学问题[J].电子学报,1995,23(10):110-116. 被引量：21
4胡瑞敏,薛东辉,姚天任,黄铁侠.神经网络方法及其在语音识别中的应用[J].高技术通讯,1995,5(6):11-15. 被引量：5
5张保轩,邵献之.基于ANN的汉语数字语音识别[J].山东电子,1995(1):20-22. 被引量：1
6蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：40
7许开宇,张曙.基于小波分析的汉语语音识别[J].哈尔滨工程大学学报,1996,17(4):20-26. 被引量：5
8孙晋文,肖建国.基于SVM文本分类中的关键词学习研究[J].计算机科学,2006,33(11):182-184. 被引量：12
9Rabiner L R.A tutorial on hidden Markov models and selected application in speech recognition[J].Proceeding of IEEE,1989;77(2):257～285
10Wilpon J G,Rabiner L R,Lee C H et al. Automatic recognition of keyword in unconstrained speech using hidden Markov models[J].IEEE Trans Acoust,Speech,Signal Processing, 1990;38(11 ): 1870～1878

引证文献6

1张宜.汉语语音识别技术的研究与发展[J].广西广播电视大学学报,2003,14(4):18-22. 被引量：3
2王新民,姚天任.基于因子分析的隐马尔可夫模型及其训练算法[J].计算机工程与应用,2004,40(15):79-81. 被引量：3
3陈晓娇,哈力木拉提.买买提.一种基于HMM的维吾尔文联机手写识别的方法[J].计算机工程与应用,2013,49(24):175-178. 被引量：1
4邹灿,李柏岩.基于BIC的语音识别模型压缩算法[J].计算机与现代化,2014(6):71-73.
5闫丹阳,姜梅,耿秀丽,闫伟.基于HMM与RBF混合模型的情感智能聊天系统[J].计算机技术与发展,2018,28(4):109-113. 被引量：1
6王新民,姚天任.一种基于SSM的HMM训练算法[J].武汉大学学报（理学版）,2003,49(5):625-628. 被引量：1

二级引证文献9

1李君,吕晓军,邵夫驰,杨恩泽,行鸿彦.铁路智能客服的架构及其技术研究[J].电子测量技术,2020(15):172-176. 被引量：1
2王新民.一种改进的隐马尔可夫模型训练算法[J].孝感学院学报,2004,24(3):74-77. 被引量：1
3王新民,姚天任.基于混合因子分析的隐马尔可夫模型[J].计算机工程与应用,2005,41(24):50-52. 被引量：1
4陆永兵,吕晓妍.图书借阅证语音挂失的设计与实现[J].情报理论与实践,2006,29(2):243-245. 被引量：1
5王新民,王勤,姚天任.基于混合因子分析隐马尔科夫模型的训练算法[J].系统仿真学报,2008,20(15):3969-3972.
6张锋.利用马尔可夫链建模PLC系统中的信道噪声[J].电力系统通信,2010,31(9):65-69. 被引量：2
7陈佳硕,付兴建.中文语音识别系统研究与探寻[J].中小学信息技术教育,2014(2):69-71.
8蒋建军,刘彤.一种AMP架构下的处理器负载均衡改进方法[J].山东农业大学学报（自然科学版）,2015,46(1):96-100. 被引量：1
9徐宁宁.交换机录音通知一致性核查方法研究及应用[J].通讯世界（下半月）,2015(7):81-82.

1赵力.基于偶数帧段输入隐马尔可夫模型的噪声环境下汉语连续语音识别研究[J].声学学报,2002,27(1):59-61. 被引量：1
2郝杰,李星.基于经典隐马尔可夫模型的汉语连续语音识别系统[J].电子与信息学报,2002,24(7):944-947. 被引量：3
3赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的汉语连续语音识别方法[J].电子学报,2000,28(7):67-69. 被引量：5
4郝杰,李星.汉语连续语音识别中关键词可信度的贝叶斯估计[J].声学学报,2002,27(5):393-397. 被引量：8
5刘刚,陈伟,郭军.汉语连续语音识别结果评价算法研究[J].China Communications,2010,7(2):132-138. 被引量：3
6王艳,冯宏伟,张利平,忽满利.基于元音检测的汉语连续语音声韵母分割[J].计算机工程与应用,2011,47(14):134-136. 被引量：7
7全惠敏,寻纯阳.汉语连续语音识别的前置处理[J].湖南大学学报（自然科学版）,1998,25(S1):110-112. 被引量：1
8赵庆卫,王作英,陆大.汉语连续语音识别中上下文相关的识别单元(三音子)的研究[J].电子学报,1999,27(6):79-82. 被引量：4
9齐耀辉,潘复平,葛凤培,颜永红.汉语连续语音识别系统中三音子模型的优化[J].计算机应用研究,2013,30(10):2920-2922. 被引量：4
10张永锋,杨影,肖莹莹.基于主成分分析的汉语连续语音切分算法[J].应用声学,2011,30(5):366-369. 被引量：3

计算机工程与应用

2001年第13期

浏览历史

内容加载中请稍等...

汉语连续语音识别中经典HMM的实验评测被引量：6

参考文献9

共引文献14

同被引文献54

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

汉语连续语音识别中经典HMM的实验评测 被引量：6

参考文献9

共引文献14

同被引文献54

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

汉语连续语音识别中经典HMM的实验评测被引量：6