汉语连续语音识别中一种新的音节间相关识别单元被引量：3

A new acoustic modeling of inter-syllable context-dependent units for Putonghua continuous speech recognition

导出

摘要考虑汉语连续语音中的协同发音现象对语音识别性能的提高是非常重要的。针对汉语语音的特点,提出了一种新的在汉语连续语音识别中考虑音节间协同发音现象,对声学模型进行细化的识别单元。然后基于语音学知识对音节间上下文影响进行分类,实现单元间状态参数的共享,降低了模型的复杂程度,保证了模型的可训练度。这种方法和传统方法的最大不同在于:这种方法完全利用语音学知识进行聚类,而传统方法采用数据驱动的聚类方式。识别实验表明,基于语音学分类的音节间相关识别单元对识别性能有明显的改善,系统的首选误识率降低了17％。 To capture the coarticulatory effects in Putonghua continuous speech is important to improve the performance of automatic speech recognition system. A new acoustic modeling technique to construct inter-syllable context-dependent units is proposed, which is based on some particular characteristics of Putonghua. The acoustic model is detailed and context-dependent units are formed after phonetic coarticulation between neighboring syllables is taken into account. Then various contextual influences between syllables are classified based on Putonghua phonetic knowledge. This phonetic classification makes sharing parameters across different units possible, which can significantly reduce the complexity of acoustic model and construct a trainable model. Compared with traditional parameter-sharing techniques, this one is purely based on phonetics, instead of acoustical data-driven clustering. Experimental results show that this technique can significantly improve system performance. The proposed method reduces error rate by 17%.

作者李春王作英

机构地区清华大学电子工程系

出处《声学学报》 EI CSCD 北大核心 2003年第2期187-191,共5页 Acta Acustica

关键词汉语音节相关识别单元连续语音识别语音信号处理声学模型协同发音

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1王作英.基于段长分布的HMM语音识别模型[A]..第二届全国汉字语音识别会议[C].庐山,1989..
2赵庆卫,王作英,陆大.汉语连续语音识别中上下文相关的识别单元(三音子)的研究[J].电子学报,1999,27(6):79-82. 被引量：4
3Lee C H, Giachin E, Rabiner L, Rosenberg A. Improved acoustic modeling for large vocabulary continuous speech recognition. Computer Speech and Language, 1992(6):103--127.
4Lee K F, Hon H W, Reddy R. An overview of the SPHINX speech recognition system. IEEE Transactions on Acoustics, Speech and Signal Processing, 1990; 38(Issue.1): 35-45.
5Huang X D, Alex Acero, Hon H W. Spoken language processing: a guide to theory, algorithm and system development. Prentice Hall, 2001:427--434.
6Hwang M Y, Huang X D. Subphonetic modeling with Markov states -- senone. In: IEEE International Conference on Acoustics, Speech, and Signal Processing, 1992.

二级参考文献6

1王作英曹洪.语音识别的改进隐含马尔可夫模型[J].863智能计算机系统主题学术会议,1988,12.
2计天颖.一种汉语连续语音识别的算法及其实现（博士学位论文）[M].清华大学电子工程系,1995,4..
3Hwanq Mei Yuh，IEEE Trans SAP，1996年，4卷，6期，412页
4计天颖，博士学位论文，1995年
5Kai-FuLee，IEEE Trans ASSP，1990年，38卷，4期，509页
6工作英，863智能计算机系统主题学术会议，1988年

共引文献6

1张宜.汉语语音识别技术的研究与发展[J].广西广播电视大学学报,2003,14(4):18-22. 被引量：3
2任纪生,王作英.一种新的潜在语义分析语言模型[J].高技术通讯,2005,15(8):1-5. 被引量：3
3赵庆卫,王作英,陆大紟.基于音节间相关识别单元的汉语连续语音识别算法[J].清华大学学报（自然科学版）,1999,39(9):65-68. 被引量：2
4肖熙,王侠,王作英.基于Dialogic语音卡实时数据采集的电话语音识别系统[J].计算机工程与应用,2003,39(17):110-114. 被引量：3
5丁鹏,徐波.综合非语境因素的语音数据分类与声学建模研究[J].声学学报,2004,29(1):23-28.
6林建臻,孙甲松,王作英.汉语语音识别的抗噪性前端算法及性能分析[J].电声技术,2004,28(3):45-48. 被引量：1

同被引文献49

1徐向华,朱杰,郭强.汉语连续语音识别中的分级聚类算法的研究和应用[J].信号处理,2004,20(5):497-500. 被引量：2
2张翠丽,张申生,李磊.基于统一受理的农业呼叫中心解决方案[J].计算机应用与软件,2006,23(10):31-32. 被引量：9
3王作英.基于段长分布的HMM语音识别模型.第二届全国汉字语音识别会议[M].庐山,1989..
4丁鹏徐波.基于决策树的海量语音数据处理与建模[A]..第六届全国人机语音通讯会议[C].,2001.291-294.
5Lee, C-H, Giachin, E., Rabiner, L., and Rosenberg, A., Improved Acoustic Modeling for Large Vocabulary Continuous Speech Recognition. Computer Speech and Language 6:103-127, 1992.
6Hwang, M-Y and Huang, X-D, Subphonetic Modeling with Markov Statew-Senone. in: IEEE International Conference on Acoustics, Speech, and Signal Processing, 1992.
7Titterington D M,Smith A F M,Makov U E. Statistical Analysis of Finite Mixture Distributions. London:John Wiley & Sons, 1985.
8Gauvain J L, Lee C H. Maximum-a-posteriori estimation for multivariate Gaussian observations of Markov chains.IEEE Trans Speech Audio Processing, 1994; 2:291-298.
9Padmanabhan Met al. Speaker clustering and transformation for speaker adaptation in speech recognition systems.IEEE Trans Speech Audio Processing, 1998; 6:71-77.
10Gao Y, Padmanabhan M, Picheny M. Speaker adaptation based on pre-clustering training speakers. In: Proc of EUROSPEECH, 1997; 3:2091-2094.

引证文献3

1许金普,诸叶平.基于语音识别的农产品价格信息采集方法[J].中国农业科学,2015,48(3):449-459. 被引量：8
2刘玉宇,吴及,王作英.汉语三音子模型观测概率比较[J].中文信息学报,2003,17(3):47-52. 被引量：2
3丁鹏,徐波.综合非语境因素的语音数据分类与声学建模研究[J].声学学报,2004,29(1):23-28.

二级引证文献10

1徐宝龙,努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.关于维吾尔语口语语料的三音子选取方法研究[J].中文信息学报,2015,29(2):118-124. 被引量：2
2许金普,许丰娟,诸叶平,刘升平,岳慧丽,刘丹.农产品市场信息采集的语音识别鲁棒性方法[J].中国农业科技导报,2015,17(4):100-106.
3林麒麟,包广清,宋旭辉,张宝强,陶佳.基于语音识别的电梯辅助控制系统设计[J].计算机与数字工程,2017,45(3):544-548. 被引量：11
4张世红.海量网页挂码信息自动采集方法仿真[J].计算机仿真,2017,34(4):280-283. 被引量：2
5钱婷婷,赵京音,杨娟,邵芳,王美凤,陈旭,郑秀国.农产品价格监测体系建设及监测预警方法进展[J].上海农业学报,2017,33(4):146-151. 被引量：14
6赵玉芹.基于三维视觉的地铁客流信息智能采集算法研究[J].微电子学与计算机,2017,34(10):101-104. 被引量：2
7阳琼芳.基于Android可语音识别的茶树种质资源APP设计与实现[J].福建电脑,2018,34(2):14-16.
8刘慧,杨玉清,鲁梦瑶,李军会,赵龙莲.农产品市场环境下语音端点检测的研究[J].自动化技术与应用,2019,38(5):129-134. 被引量：1
9罗毅,申谋.贵州省农产品价格监测工作现状与提升建议[J].农技服务,2024,41(6):106-110.
10买买提阿依甫,帕丽旦·木合塔尔,郭文强.基于三音子模型的柯尔克孜最优语料选取算法[J].计算机仿真,2024,41(8):296-302.

1赵庆卫,王作英,陆大紟.基于音节间相关识别单元的汉语连续语音识别算法[J].清华大学学报（自然科学版）,1999,39(9):65-68. 被引量：2
2李春,王作英.基于语音学分类的汉语三音子识别单元的算法[J].清华大学学报（自然科学版）,2003,43(1):16-19. 被引量：4
3赵庆卫,王作英,陆大.汉语连续语音识别中上下文相关的识别单元(三音子)的研究[J].电子学报,1999,27(6):79-82. 被引量：4
4霍云.漫谈各种复用技术[J].中国有线电视,2004(16):6-10.
5白俊贤,米川.基于声韵母的汉语语音识别[J].通信电源技术,2014,31(6):83-84. 被引量：1
6胡瑞敏,姚天任,黄铁侠.基于神经网络的通信网信号识别单元[J].通信技术,1994,27(4):5-8.
7赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的汉语连续语音识别方法[J].电子学报,2000,28(7):67-69. 被引量：5
8赵靖娜.英语专业本科毕业论文写作常见语言问题探讨[J].海外英语,2014(21):120-122.
9张红艳,崔香兰.日语古典语法入门(9)——助词(一)[J].日语知识,2009(6):4-6.
10徐向华,朱杰,郭强.汉语连续语音识别中的分级聚类算法的研究和应用[J].信号处理,2004,20(5):497-500. 被引量：2

声学学报

2003年第2期

浏览历史

内容加载中请稍等...

汉语连续语音识别中一种新的音节间相关识别单元被引量：3

参考文献6

二级参考文献6

共引文献6

同被引文献49

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

汉语连续语音识别中一种新的音节间相关识别单元 被引量：3

参考文献6

二级参考文献6

共引文献6

同被引文献49

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

汉语连续语音识别中一种新的音节间相关识别单元被引量：3