汉语孤立字全音节实时识别系统被引量：4

A real-time speaker-dependent syllable recognition system of the complete vocabulary of Chinese

导出

摘要本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处理板为硬件基础,建立了一个特定人汉语普通话全音节实时识别系统.该系统针对汉语普通话的语音特点,采用了分层识别策略.整个系统响应时间小于0.2秒,用4遍1240个全音节语音对系统进行的严格测试表明:系统四声识别的平均正确率为99％左右,音节识别前5个候选的正确识别率分别为82％,91％,94％,96％,97％;同时,本文根据这一测试结果建立了相应的声韵母混淆矩阵和基于Shepard方法的相似度集群分析树图,并对照汉语语音合成清晰度测试结果及汉语语音知觉结构的集群分析结果,对本系统各部分进行了较为深入的分析,提出了相应的改进措施. Based on a large number of speech experiments, Mandarin speech recognition approaches have been thoroughly studied, and a real-time speaker-dependent all-syllable recognition system of Mandarin has been developed on an IBM PC/AT microcomputer with a high-speed digital signal processing board TMS320C25-E. In accordance with the phonetic characteristics of Mandarin, the three-stage recognition strategy is adopted in this system. Experiments for the speech datas of 4 times 1240 syllables show that, average correct rate of four tone recognition is about 99%, correct rates of the first 5 candidates of syllable recognition are 82%, 91%, 94%, 96%, and 97% respectively, and the whole system response time is less than 0.2 second. In addition, the Mandarin initials and finals confusion matrices, and the corresponding hierarchical clustering diagram of the similarity are obtained from the experiment results, and they are analyzed in comparision with the references [1,2] so as to further improve the system performance.

作者陈韬李昌立莫福源

机构地区中国科学院声学研究所

出处《声学学报》 EI CSCD 北大核心 1993年第3期161-171,共11页 Acta Acustica

基金国家自然科学基金资助项目

关键词语音识别元音识别汉语

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1陈韬，1990年
2陈永彬，语言信号处理，1990年
3吴宗济，实验语音学概要，1989年
4张家禄，J Chin Lingustics，1982年，10卷，190页
5张家禄，心理学报，1981年，1卷，76页

同被引文献16

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
3齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
4曹剑芬.现代语音基础知识[M].北京:人民教育出版社,1990..
5王成友,汤叔祺,梁甸农,陈辉煌,唐朝京.语音识别中多种特征信息综合利用的方法[J].声学学报,1997,22(2):111-115. 被引量：6
6Taisuke Itoh, Kazuya Takeda and Fumitada Itakura.Acoustic analysis and recognition of whispered speech. In:Proc. ICASSP, Orlando, Florida, USA, 2002:389-392.
7Robert W. Morris, Mark A. Clements. Reconstruction of speech from whispers. Medical Engineering ~ Physics,2002; 24(8): 515-520.
8Higashikawa M, Nakai K, Sakakura A, Takahashi H. Perceived pitch of whispered vowels-relationship with formant frequencies: a preliminary study. Journal of Voice,1996; 10(2): 155-158.
9Izmirli O. Using a spectral flatness based feature for audio segmentation and retrieval. In: Proc. International Symposium on Music Information Retrieval, Plymouth, USA,2000:100-101.
10Fakotakis N, Sirigos J, Kokkinakis G. High performance text-independent speaker recognition system based on voiced/unvoiced segmentation and multiple neural nets.In: Proc. EUROSPEECH, Budapest, Hungary, 1999:979~982.

引证文献4

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2王连军,张保轩.一种快速提取基音周期的新方法[J].山东电子,1995(2):20-21. 被引量：1
3杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
4郭磊,张泽宝.语音识别技术在军用测试设备中的应用[J].航空兵器,2006,13(5):61-64. 被引量：2

二级引证文献41

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
3杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
4林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：24
5樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
6杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
7国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
8王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7
9GUO Yanmeng FU Qiang YAN Yonghong.Speech endpoint detection in real noise environments[J].Chinese Journal of Acoustics,2007,26(1):39-48. 被引量：5
10钱博,李燕萍,唐振民,徐利敏.基于频域能量分布分析的自适应元音帧提取算法[J].电子学报,2007,35(2):279-282. 被引量：8

1任百强,陈学泮.语音识别技术在计算机控制系统中的应用研究[J].电脑应用技术,1993(31):38-43.
2田慧.指纹特征匹配算法的研究与实现[J].计算机工程与设计,2008,29(12):3258-3260. 被引量：1
3陈志辉,吴敏敏.元音识别的几种分类模型的比较与分析[J].莆田学院学报,2012,19(5):62-65.
4唐亚伟.亚伟中文速录机的诞生与应用[J].中文信息,1994,11(5):42-43.
5张东波.基于动态自适应RBF网络的元音识别研究[J].计算机与现代化,2006(7):15-17. 被引量：1
6江铭虎,王琳,江铭炎.智能听觉计算机操作系统的设计与实现[J].山东师范大学学报（自然科学版）,1994,9(3):63-67. 被引量：1
7冯志全,蒋彦.手势识别研究综述[J].济南大学学报（自然科学版）,2013,27(4):336-341. 被引量：29
8Boutkhil Sidaoui,Kaddour Sadouni.Efficient Binary Tree Multiclass SVM Using Genetic Algorithms for Vowels Recognition[J].通讯和计算机（中英文版）,2012,9(10):1116-1123.
9刘伏虎,任世宏,朱贵明.一种图像目标实时识别系统[J].北京理工大学学报,1997,17(6):717-722.
10张东波,王耀南.一种新型模糊-粗神经网络及其在元音识别中的应用[J].控制与决策,2006,21(2):221-224. 被引量：5

声学学报

1993年第3期

浏览历史

内容加载中请稍等...

汉语孤立字全音节实时识别系统被引量：4

参考文献5

同被引文献16

引证文献4

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

汉语孤立字全音节实时识别系统 被引量：4

参考文献5

同被引文献16

引证文献4

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

汉语孤立字全音节实时识别系统被引量：4