语音识别中动态时间规整和隐马尔可夫统一模型被引量：5

DTW and HMM Unified Model in Speech Recognition

下载PDF

导出

摘要对于目前在语音识别中广泛使用的两种技术即动态时间规整（DTW）技术和隐马尔可夫模型（HMM）的本质联系，提出了二者的统一模型（DHUM，DTWandHMMUni-fiedModel），并分别给出DTW和HMM向DHUM的转换关系。文中还提出了用DHUM解决更接近语音实际情况的高阶HMM作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明，建立在DHUM之上的识别器的识别性能不低于DTW和HMM识别器。 Constructs a new DTW and HMM unified model (DHUM) by catching the essence connection between DTW and HMM. The transformations from DTW to DHUM and from HMM to DHUM are presented. DHUM seems to be a proper way to resolute the problem of high class HMM'S excessive calculation. The result of middle word corpus speech recognition (SR) test shows that the SR quality of DHUM is not lower than that of DTW and HMM.

作者张焱张杰黄志同

机构地区南京理工大学自动控制系

出处《数据采集与处理》 CSCD 1997年第3期218-222,共5页 Journal of Data Acquisition and Processing

基金江苏省自然科学基金南京理工大学科研发展基金

关键词语音识别动态时间规整隐马尔可夫模型 speech recognition speech processing dynamic time warping hidden Markov model

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1马明,张杰,王建宇,黄志同.语音识别中隐马尔可夫模型初值的估计[J].数据采集与处理,1997,12(2):96-100. 被引量：3
2马明,张元,王建宇,黄志同.语音识别中的动态时间规正和隐马尔可夫模型等价性研究[J].郑州大学学报（自然科学版）,1996,28(2):34-39. 被引量：2

二级参考文献2

1战普明,王作英,陆大.语音识别隐马尔可夫模型的改进[J].电子学报,1994,22(1):9-15. 被引量：9
2国立新,莫福源,李昌立.基于连续高斯混合密度HMM的汉语全音节语音识别研究[J].声学学报,1995,20(5):321-329. 被引量：11

共引文献3

1何新,王晓兰,周献中.广义模型的音频分析方法[J].火力与指挥控制,2005,30(5):52-53. 被引量：1
2张焱,张杰,黄志同.语音识别中隐马尔可夫模型状态数的研究[J].南京理工大学学报,1998,22(3):208-211. 被引量：5
3刘伶俐,王朝立,于震.CHMM语音识别初值选择方法的研究[J].上海理工大学学报,2012,34(4):323-326. 被引量：4

同被引文献11

1王和顺,黄惟公,邓成中.基于SPCE061A的语音识别系统的研究[J].计算机工程与设计,2004,25(12):2222-2224. 被引量：16
2俞铁城.语音识别的发展现状[J].通讯世界,2005(2):56-56. 被引量：13
3罗俊光,汤荣江.基于DSP的非特定人语音识别系统[J].微计算机信息,2007,23(04Z):195-196. 被引量：11
4张尧庭，多元统计分析引论，1982年，1页
5IBM中国研究中心语音研究小组，微电脑世界，1997年，17卷，21页
6Christoph Gerber. A General Approach to Speech Recognition [J]. Electronic Workshops in Computing, 1995(41).
7公安部政治部.笔迹检验[M]警官教育出版社,1999.
8唐道南,秦勇,沈丽琴,郭雪峰,朱小瑾.语音识别技术和应用[J].微电脑世界,1997(11):41-53. 被引量：3
9英锋,冯玉芬.基于SPCE061A的语音识别系统的设计[J].微计算机信息,2008,24(17):121-122. 被引量：6
10张焱,姜惠春,黄志同.隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究[J].声学学报,1998,23(6):555-563. 被引量：8

引证文献5

1陈晓红,贾玉文.签名笔迹动态特征的理论研究[J].中国司法鉴定,2007(1):40-43. 被引量：10
2李佳,何鹏举,吴礼裕.具有语音识别功能的无线网络节点开关控制系统[J].科技与生活,2011(8):108-110. 被引量：2
3张杰,余志刚,黄志同.语音识别中广义模型及其算法收敛性分析[J].计算机工程与应用,2000,36(2):60-62.
4蔡骅,张杰,黄志同.Fisher算法在语音声学模型分析中的研究与应用[J].数据采集与处理,2000,15(4):471-475. 被引量：1
5周贤娟,赵发,冷强,杨欢.具有语音识别功能的无线传感器网络节点设计[J].单片机与嵌入式系统应用,2014,14(7):57-59.

二级引证文献13

1李学军,刘晓丹.物证技术的创新及侦查方法的法制化[J].法学家,2008(1):103-106.
2陈晓红,贾玉文,刘建伟.论签名笔迹的频谱分析方法[J].中国司法鉴定,2009(5):59-62. 被引量：3
3贾治辉,朱兰.签名笔迹重新鉴定实务问题探究[J].中国司法鉴定,2010(6):27-32. 被引量：3
4赵奎兵,段富海.基于ZigBee节点的智能家居系统语音控制设计[J].现代电子技术,2012,35(20):5-8. 被引量：10
5陈燕秀.基于zigbee的的语音家居控制系统设计[J].聊城大学学报（自然科学版）,2014,27(2):98-102. 被引量：1
6张程瑜,冯秀丽,刘杰,刘潇.基于Fisher算法对现代黄河三角洲叶瓣垂向环境演变的初步验证[J].海洋科学,2015,39(10):80-84.
7申思,韩丹岩.运用笔迹三维信息提取分析仪对正常签名书写力的研究[J].中国司法鉴定,2015(6):73-79. 被引量：2
8欧阳国亮,王世全,冯明帅.贾玉文先生笔迹学思想综述[J].广东公安科技,2018,26(1):26-29. 被引量：3
9卫燕茹.浅析签名笔迹鉴定[J].法制博览,2017(2):92-93+89. 被引量：3
10周鹏,高树辉.笔画压痕立体形态特征提取分析[J].中国人民公安大学学报（自然科学版）,2020,26(3):14-21. 被引量：2

1张毅刚,焦玉华,牛夏牧,俞龙江.基于指纹特征数字水印算法的身份认证技术研究[J].电子学报,2003,31(z1):2131-2134. 被引量：1
2颜志,张兴,王文博.认知无线电网络中用户行为建模综述[J].数字通信,2009,36(4):16-19. 被引量：2
3王舒,谭敏生,周欢,刘尖学.基于间接信任表的无线传感网络信任模型[J].网络安全技术与应用,2014(12):82-83.
4雷文太,黄仕家.超宽带雷达成像理论的初步探讨[J].现代电子技术,2002,25(3):74-76.
5万家练.变形代换是解题的最基本方法[J].数学通报,2007,46(11):50-51. 被引量：1
6张杰,余志刚,黄志同.语音识别中广义模型及其算法收敛性分析[J].计算机工程与应用,2000,36(2):60-62.
7张福俊,王义波,尹燕霞.现代大学建筑环境与人文精神的本质联系与互动[J].科技创新导报,2011,8(23):32-32.
8石荣,阎剑,张聪.运动单站定位与多站测向定位的统一理论模型[J].舰船电子对抗,2013,36(3):1-6. 被引量：4
9吴杰.S—570扫描电镜聚焦电路的分析与维修[J].福建分析测试,1994,3(1):46-48.
10苏懋康.系统动力学延迟环节的基本性质(Ⅱ)[J].系统工程,1990,8(4):16-24.

数据采集与处理

1997年第3期

浏览历史

内容加载中请稍等...

语音识别中动态时间规整和隐马尔可夫统一模型被引量：5

参考文献2

二级参考文献2

共引文献3

同被引文献11

引证文献5

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

语音识别中动态时间规整和隐马尔可夫统一模型 被引量：5

参考文献2

二级参考文献2

共引文献3

同被引文献11

引证文献5

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

语音识别中动态时间规整和隐马尔可夫统一模型被引量：5