基于段长分布的HMM语音识别模型被引量：42

Duration Distribution Based HMM Speech Recognition Models

下载PDF

导出

摘要本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模型 (DDBHMM ) .非特定人连续语音实验结果表明 ,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高 (误识率降低了 17 8% ) ,展示了DDBHMM的良好的性能 ,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间 . In order to overcome the defects of the duration modeling of homogeneous HMM in speech recognitions, a Duration Distribution Based HMM (DDBHMM) is proposed based on a formalized definition of a left-to-right inhomogeneous Markov model, which has been demonstrated that it can be identically defined by either the state duration or the state transition probabilities. The speaker independent continuous speech recognition experiments have shown that, by only modeling the state duration in DDBHMM, a significant improvement (17.8% error rate reduction) has been achieved comparing with the classical HMM. The ideal properties of DDBHMM will give promise to many aspects of speech modeling, such as the modeling of the state duration, speed variation, speech discontinuity and the inter frame correlation.

作者王作英肖熙

机构地区清华大学电子工程系

出处《电子学报》 EI CAS CSCD 北大核心 2004年第1期46-49,共4页 Acta Electronica Sinica

关键词段长语音识别 DDBHMM Markov processes Mathematical models Probability

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
2王作英.基于段长分布的HMM语音识别模型 [A]..第二届全国汉字汉语识别会议 [C].庐山,1989.9.

共引文献16

1吴治国,刘玉宇,王作英.基于段长分布的HMM的资源受限语音识别系统[J].计算机应用,2003,23(z2):316-318.
2范金武.汉语辅音实验研究述评[J].文教资料,2007(34):203-205.
3冉启斌,石锋.普通话单音节中爆发音的VOT分析[J].南开语言学刊,2007(2):21-31. 被引量：16
4田昊,张道行.人工耳蜗的言语编码方案与汉语声母语谱特点[J].中国听力语言康复科学杂志,2005,34(1):25-27. 被引量：4
5栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
6张家騄.汉语普通话区别特征系统[J].声学学报,2005,30(6):506-514. 被引量：27
7戚建宇,赵鹤鸣,何松.基于HMM的普通话单字发音准确度评价方法研究[J].计算机工程与应用,2007,43(7):224-226. 被引量：3
8庄洁.越南留学生习得普通话塞音和塞擦音实验研究[J].菏泽学院学报,2009,31(3):114-118. 被引量：1
9汤霖,黄建中,尹俊勋.基于语音知识的音节切分[J].中文信息学报,2010,24(4):91-95. 被引量：4
10章斯宇,孟子厚.混响环境下汉语语音知觉特征的实验分析[J].声学学报,2013,38(1):85-91. 被引量：4

同被引文献276

1罗骏,欧智坚,王作英.基于相关子空间本征音分析的MAP快速自适应[J].清华大学学报（自然科学版）,2004,44(6):829-832. 被引量：1
2王志洁.英汉音节鼻韵尾的不同性质[J].现代外语,1997,20(4). 被引量：19
3吴宗济.试论“人－机对话”中的汉语语音学[J].世界汉语教学,1997,11(4):4-21. 被引量：5
4牛雪莲.基于Android的英语听力移动学习平台设计与实现[J].自动化与仪器仪表,2016(2):41-42. 被引量：22
5李向阳,苗壮.自由文本信息抽取技术[J].情报科学,2004,22(7):815-821. 被引量：23
6方敏,浦剑涛,李成荣,台宪青.嵌入式语音识别系统的研究和实现[J].中文信息学报,2004,18(6):73-78. 被引量：19
7李明琴,李涓子,王作英,陆大.中文语义依存关系分析的统计模型(英文)[J].计算机学报,2004,27(12):1679-1687. 被引量：9
8何伟方,青木由直.DP动态匹配算法实现语音的实时识别[J].数据采集与处理,1989,4(1):12-16. 被引量：2
9胡斌,汤伟,刘晓明.基于自然语言理解的文本标图系统设计与实现[J].解放军理工大学学报（自然科学版）,2005,6(2):132-136. 被引量：9
10陈治平,王雷.基于自学习K近邻的垃圾邮件过滤算法[J].计算机应用,2005,25(B12):7-8. 被引量：15

引证文献42

1曹剑芬,李爱军,胡方,张利刚.语音学知识在语音识别中的应用:案例分析[J].清华大学学报（自然科学版）,2008,48(S1):748-753. 被引量：3
2李明琴,李涓子,王作英,陆大.语义分析和结构化语言模型[J].软件学报,2005,16(9):1523-1533. 被引量：7
3刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
4陈立伟,张晔.基于改进的隐马尔可夫和神经网络混合模型的语音识别[J].应用声学,2006,25(2):90-95.
5王宏,郭艳丽,贾新民.基于HMM的孤立字识别[J].昌吉学院学报,2006(1):94-98. 被引量：3
6范斐斐,李振波,陈佳品.基于K均值分段的语音识别在微机器人控制系统中的应用[J].电子技术应用,2006,32(5):4-6. 被引量：2
7赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
8贺无名.语音识别技术及其研究进展[J].中国科技信息,2006(18):157-158. 被引量：3
9孙健,王作英.融合段长信息的中、英文语种辨识[J].模式识别与人工智能,2006,19(5):567-571.
10王作英,孙健.一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J].电子与信息学报,2007,29(4):867-869. 被引量：1

二级引证文献160

1万济萍,刘子菡,王玥,刘婉姬,张清涛,辛杰.基于语音识别技术口语自动评测的专利分析[J].电声技术,2012,36(S1):53-56. 被引量：1
2曹剑芬.语音处理上如何逐渐减少对具体语料的依赖?[J].清华大学学报（自然科学版）,2009(S1):1380-1387. 被引量：3
3于一,廖睿,叶大田.电子病历结构化方法概述[J].北京生物医学工程,2007,26(1):103-106. 被引量：16
4邓莎,张振宇.语音识别技术分析及展望[J].现代计算机,2007,13(4):33-35. 被引量：4
5王欢良,钱瑶,F.K.Soong,韩纪庆.基于声调建模的带噪汉语数字串语音识别[J].声学学报,2007,32(5):454-460. 被引量：2
6马会丽,唐红,赵国锋.电话外呼系统的研究与实现[J].计算机应用,2007,27(9):2343-2345. 被引量：5
7张军,韦岗,余华.基于特征分量输出概率加权的多数据流鲁棒语音识别方法[J].声学学报,2008,33(2):102-108. 被引量：2
8龙毅,张翎,胡雷地,闾国年.移动GIS中语音与自然语言的应用模式探讨[J].测绘科学技术学报,2008,25(1):8-12. 被引量：3
9王智国,吴及,戴礼荣,王仁华.一种对加性噪声和信道函数联合补偿的模型估计方法[J].声学学报,2008,33(3):238-243. 被引量：5
10曾毓敏,吴镇扬.基于浊音语音谐波谱子带加权重建的抗噪声说话人识别[J].东南大学学报（自然科学版）,2008,38(6):935-941. 被引量：5

1赵庆卫,肖熙,王作英.段长信息在连续语音识别中的应用研究[J].声学学报,2000,25(2):175-181. 被引量：5
2杨浩荣,刘加,王作英,陆大.GMD-SDDBHMM语音识别模型和分类训练方法[J].通信学报,1998,19(4):35-42. 被引量：3
3吾守尔.斯拉木,刘俊,王飞飞.基于DDBHMM的维吾尔语语音声学层识别系统研究[J].新疆大学学报（自然科学版）,2010,27(4):381-386. 被引量：2
4欧智坚,王作英.连续语音识别中利用帧间相关性的研究[J].计算机工程与应用,2001,37(15):25-27. 被引量：1
5杨浩荣,王作英,陆大紟.语音识别HMM中引入帧间相关信息的一种参数化模型[J].电子学报,1998,26(10):50-54. 被引量：3
6荆嘉敏,刘加,刘润生.基于HMM的语音识别技术在嵌入式系统中的应用[J].电子技术应用,2003,29(10):12-14. 被引量：12
7吴及,肖熙,许琳,王作英.非凸段长分布隐含Markov模型的搜索算法[J].清华大学学报（自然科学版）,2005,45(7):924-927.
8游展,肖熙,王作英.连续语音的三音子DDBHMM识别方法[J].清华大学学报（自然科学版）,2009(4):506-509.
9赵庆卫,王作英.利用段长信息的改进连续语音识别算法[J].清华大学学报（自然科学版）,1997,37(10):87-90. 被引量：5
10袁里驰.基于改进的隐马尔科夫模型的语音识别方法[J].中南大学学报（自然科学版）,2008,39(6):1303-1308. 被引量：20

电子学报

2004年第1期

浏览历史

内容加载中请稍等...

基于段长分布的HMM语音识别模型被引量：42

参考文献2

共引文献16

同被引文献276

引证文献42

二级引证文献160

相关作者

相关机构

相关主题

浏览历史

基于段长分布的HMM语音识别模型 被引量：42

参考文献2

共引文献16

同被引文献276

引证文献42

二级引证文献160

相关作者

相关机构

相关主题

浏览历史

基于段长分布的HMM语音识别模型被引量：42