基于3维空间Viterbi算法的汉语连续语音识别方法被引量：5

Recognition of Chinese Continuous Speech Based on 3-Dimension Viterbi Search

下载PDF

导出

摘要本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位的HMM状态和时间的 3维空间Viterbi算法来实现 .语音声学处理和语音言语处理的结合 ,采用修改型Earley分析法的Top Done型文法分析器和OnePassDP为基础的帧同步识别算法来实现 .在由 10名话者发音的有关旅馆预约指南的识别困难度是 2 7 3的 10 70句子的识别实验中 ,总平均识别率达到 94 4% . This paper presents a recognition method of Chinese continuous speech,in which p honetic and prosodic features are integrated in terms of 3-Dimension Viterbi se arch.The phonetic information is modeled by 60 phonemic HMMs and the prosodic in formation by 8 tone HMMs.Both recognitions are synchronized based on 3-Dimensio n Viterbi search.A frame-synchronous parsing algorithm for CFG based on a top- down strategy is used for parsing processing.The task is related to the hotel re servation process,of which the perplexity is 27 3.For 1070 utterances produced by each of ten speakers,the average sentence recognition rate was 94 4%.

作者赵力邹采荣吴镇扬

机构地区东南大学无线电工程系

出处《电子学报》 EI CAS CSCD 北大核心 2000年第7期67-69,58,共4页 Acta Electronica Sinica

基金国家自然科学基金资助课题

关键词汉语连续语音识别三维空间 VITERBI算法 recognition of Chinese continuous speech phonemic HMM tone HMM 3-Dimension Vite rbi search

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1Gao Y，Proc ICASSP，1995年，77页
2Zhao L，IEICETRANSIN Fand SYST，1995年，E78D卷，6期，669页
3Chien L F，IEEE Trans SAP，1993年，1卷，2期，221页

同被引文献59

1王维兰,陈万军.藏文字丁、音节频度及其信息熵[J].术语标准化与信息技术,2004(2):27-31. 被引量：17
2高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：35
3何新,王晓兰,周献中.汉语语音识别中的一种音节分割方法[J].火力与指挥控制,2004,29(6):94-96. 被引量：5
4扎西次仁.《中华大藏经·丹珠尔》藏文对勘本字频统计分析[J].中国藏学,1997(2):122-133. 被引量：19
5江荻,董颖红.藏字叠加结构线性处理统计分析[J].中文信息,1994,11(4):44-46. 被引量：11
6江荻,董颖红.藏文信息处理属性统计研究[J].中文信息学报,1995,9(2):37-44. 被引量：20
7李爱军.友好语音的声学分析[J].中国语文,2005(5):418-431. 被引量：19
8蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：40
9Yoshimitsu Hirata, Seiichi Nakagawa. Speaker adaptation of continuous parameter HMM[A]. International Conference Spoken Language Processing'94[C]. KOBE, JAPAN. November 1994. 67 - 70.
10Gauvian J L, Lee C H. Maximum a posteriori estimation for multivariate Gaussian mixture observations of Markov chains [J]. IEEE Trans on Speechand Audio Processing, 1994,2(2):291- 298.

引证文献5

1陈彧.不同情感状态下的普通话言语清晰度分析[J].海南大学学报（人文社会科学版）,2012,30(5):69-76. 被引量：1
2才让卓玛,李永明,才智杰.基于Mealy机的藏文字构件分解[J].电子学报,2015,43(5):935-939. 被引量：5
3陈太波,张翠芳.多特征和SVM改进的语音关键词识别系统[J].小型微型计算机系统,2019,40(11):2291-2296. 被引量：7
4朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：17
5赵力,邹采荣,吴镇扬.基于MAP算法的无教师讲者自适应的研究[J].应用科学学报,2003,21(4):353-356.

二级引证文献30

1李瑛.糖脂消丸治疗2型糖尿病临床研究[J].河南中医,2000,20(3):31-32.
2陈彧.播音语速与言语清晰度的关系研究——以三名军事节目主持人的语音样品为例[J].新闻界,2012(18):26-31. 被引量：3
3拉巴顿珠,欧珠.现代藏文基字识别的算法设计[J].西藏大学学报（社会科学版）,2016,31(2):82-88. 被引量：3
4才智杰,孙茂松,才让卓玛.一种基于向量模型的藏文字拼写检查方法[J].中文信息学报,2018,32(9):47-55. 被引量：14
5张玉田,关白.藏文音节七元组软件算法设计与实现[J].电脑知识与技术,2019,15(2):195-197. 被引量：1
6张云翔,李智诚.面向电力行业的热词语音识别技术[J].现代计算机,2020,26(22):14-17. 被引量：4
7陆云飞,陆飞,方路平,葛慧青,潘清.应用小波多尺度特征检测机械通气人机不同步[J].小型微型计算机系统,2020,41(12):2677-2682. 被引量：6
8刘家学,李蒙阳.基于Mealy机的航空电子组件仿真模型[J].火力与指挥控制,2020,45(12):165-170. 被引量：1
9陈国翠,顾桂梅,余晓宁,李占斌.融合PHOG和BOW-SURF特征的接触网绝缘子缺陷检测方法[J].小型微型计算机系统,2021,42(1):172-177. 被引量：15
10潘丽鹏.嵌入式英语语音识别控制系统研究[J].微型电脑应用,2021,37(6):73-75. 被引量：1

1赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究[J].声学学报,2001,26(3):259-263. 被引量：3
2赵力,邹采荣,吴镇扬.汉语连续语音识别中语音处理和语言处理统合方法的研究[J].声学学报,2001,26(1):73-78. 被引量：9
3赵力.基于偶数帧段输入隐马尔可夫模型的噪声环境下汉语连续语音识别研究[J].声学学报,2002,27(1):59-61. 被引量：1
4黄利彬,曲爱华.基于灵敏度的雷达组网性能分析[J].舰船电子工程,2010,30(2):111-113.
5王艳,冯宏伟,张利平,忽满利.基于元音检测的汉语连续语音声韵母分割[J].计算机工程与应用,2011,47(14):134-136. 被引量：7
6刘刚,陈伟,郭军.汉语连续语音识别结果评价算法研究[J].China Communications,2010,7(2):132-138. 被引量：3
7赵力,邹采荣,吴镇扬.基于连续分布型HMM的汉语连续语音的声调识别方法[J].信号处理,2000,16(1):20-23. 被引量：6
8王永林.俄罗斯“亚马尔”卫星通信系统简介[J].电信技术研究,1997(1):57-58.
9王永林.俄罗斯“亚马尔”卫星通信系统[J].电信技术研究,1996(9):26-30.
10王永林.俄罗斯“亚马尔”卫星通信系统的进展[J].电信技术研究,1998(11):42-43.

电子学报

2000年第7期

浏览历史

内容加载中请稍等...

基于3维空间Viterbi算法的汉语连续语音识别方法被引量：5

参考文献3

同被引文献59

引证文献5

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于3维空间Viterbi算法的汉语连续语音识别方法 被引量：5

参考文献3

同被引文献59

引证文献5

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于3维空间Viterbi算法的汉语连续语音识别方法被引量：5