基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究被引量：16

Objective evaluation of vowels of standard Chinese pronunciation based on formant pattern

导出

摘要提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验结果表明,全分类模型可以达到90%以上的分类正确率,客观测试与专家主观评估的相似度达到82%,在性能上超过了传统的以倒谱系数为特征的隐含马尔科夫模型方法。 A method used for objective evaluation of pronunciation of vowels in standard Chinese is presented. The formant patterns of vowels are selected as the main features and an improved evaluation algorithm based on Support Vector Machine is proposed. In this algorithm, two-level classification strategy is employed. A full-classification model and a sub-classification model are trained for each vowel. The pronunciation quality is evaluated based on the classification results of this two-level strategy with evaluation model of each vowel. The new evaluation method is compared with traditional methods such as HMM posterior probability scoring method and feature of Mel-Frequency Cepstrum Coefficients （MFCC）, and the results show that the performance is effectively improved by the proposed method. The correlation of scores between human testers and machine has achieved 82%.

作者董滨赵庆卫颜永红

机构地区中国科学院声学研究所中科信利语音实验室

出处《声学学报》 EI CSCD 北大核心 2007年第2期122-128,共7页 Acta Acustica

基金国家973项目支持(2004CB318106)

关键词客观测试方法汉语普通话共振峰发音韵母支持向量机算法分类模型水 Algorithms Feature extraction Probability Standards Support vector machines

分类号 O428 [理学—声学]

引文网络
相关文献

参考文献14

1Kim Y, Franco H, Neumeyer L. Automatic pronunciation scoring of specific phone segments for language instruction.in Proc. of EUROSPEECH 97, Rhodes, Greece: 649-652.
2Neumeyer L, FYanco H, Digalakis V, Weintraub M. Automatic scoring of pronunciation quality. Speech Communication, 2000; 30:83-93.
3Neumeyer L, Franco H, Weintraub M, Price P. Automatic text-independent pronunciation scoring of foreign language student speech. Proc. of ICSLP 96, 1996, Philadelphia,Pennsylvania: 1457-1460.
4Franco H, Abrash V, Precoda K, Bratt H, Rao R,Butzberger J. The SRI EduSpeak^TM System: Recognition and Pronunciation Scoring for Language Learning. Proceedings of INSTIL 2000, 2000, Dundee, Scotland: 121-125.
5Philip Schmid. Explicit N-best formant features for segment-based speech recognition. PhD thesis, Computer Science and Engineering, Oregon Graduate Institute of Science & Technology, 1996:53-60.
6Cortes C, Vapnik V. Support-vector networks. Machine Learning, 1995; 20:273-297.
7Vapnik V, Levin E, Le Cun Y. Measuring the VCdimension of a learning machine. Neural Computation,1994; 6:851-876.
8吕萍,颜永红.基于回归分析的语音识别快速自适应算法[J].声学学报,2005,30(3):222-228. 被引量：4
9DONG Bin, ZHAO Qingwei, YAN Yonghong. Automatic assessment of pronunciation quality. Proceedings of 4th International Symposium on Chinese Spoken Language Processing 2004, Hong Kong, 2004:137-140.
10鲍怀翘.普通话单元音的生理解释[J].中国语文,1984,2:45-45.

二级参考文献39

1陆致极.试论普通话音位的区别特征[J].语文研究,1987(4):10-20. 被引量：17
2张家騄.汉语普通话区别特征系统[J].声学学报,2005,30(6):506-514. 被引量：28
3齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
4张家禄齐士钤宋美珍等.汉语声调在言语可懂度中的重要作用.声学学报,1981,7:237-237.
5Helmholtz H L F von. On the sensations of tone as a physiological basis for the theory of music, Dover, New York,1954.
6Seebeck A. Uber die Definition des Tones. Ann. Phys.Chem., 1843; 60: 449-481.
7Békésy, G. von, Experiments in Hearing, McGraw-Hill,New York, 1960.
8Schouten J F, Ritsma R J, Cordozo B J. Pitch of the residue. J. Acoust. Soc. Am., 1962; 34: 1418-1424.
9Goldstein J L. An optimum processor theory for the central formation of the pitch of complex tones. J. Acoust. Soc.Am., 1973; 54:1496-1517.
10Meddis R, O'Mard L. A unitary model of pitch perception.J. Acoust. Soc. Am. 1997; 102(3): 1811-1820.

共引文献54

1刘新中,陆晨,李旭,史长征.普通话舌尖元音主要特征及其决定因素[J].中国语音学报,2023(1):63-80. 被引量：1
2黄玮,冉启斌.从声学距离计算看汉语声韵母的特点[J].中国语音学报,2022(2):133-145.
3胡予涵.基于语言层级系统的中英日语对比分析[J].汉字文化,2021(S02):40-42.
4孙雪,石锋.自然语音与国际音标元音发音比较分析[J].南开语言学刊,2009(2):21-33. 被引量：10
5章斯宇,孟子厚.基于混叠效应下听感相似度的普通话声母聚类分析[J].清华大学学报（自然科学版）,2009(S1):1262-1265. 被引量：6
6冯晓亮,孟子厚.送气辅音与非送气辅音的区别特征参数[J].清华大学学报（自然科学版）,2009(S1):1266-1269. 被引量：1
7魏明果.方言比较的特征提取与矩阵分析[J].学术问题研究,2009,0(1):75-78.
8张家騄.汉语普通话区别特征系统树状图[J].声学学报,2006,31(3):193-198. 被引量：17
9王炜,吕萍,颜永红.一种改进的基于层次聚类的说话人自动聚类算法[J].声学学报,2008,33(1):9-14. 被引量：4
10钱博,李燕萍,唐振民,徐利敏.基于神经网络集成的说话人识别算法仿真研究[J].系统仿真学报,2008,20(5):1285-1288. 被引量：5

同被引文献131

1王士进,孟猛,梁家恩,徐波.基于Multilingual的音素识别及其在语种识别中的应用[J].清华大学学报（自然科学版）,2008,48(S1):678-682. 被引量：2
2陈洪文,于黎明.听力计检定和声场校准[J].中华耳科学杂志,2003,1(4):63-67. 被引量：18
3呼和.蒙古语元音的声学分析[J].民族语文,1999(4):58-60. 被引量：12
4黄申,李宏言,王士进,梁家恩,徐波.辅助语音评分系统中一种流利度自动评分方法[J].清华大学学报（自然科学版）,2009(S1):1349-1355. 被引量：5
5马晓琴.陕北地区普通话水平测试中常见声母、韵母错误类型分析[J].陕西教育学院学报,2004,20(2):93-96. 被引量：2
6于珏,李爱军,王霞.上海普通话与普通话元音系统的声学特征对比研究[J].中文信息学报,2004,18(6):66-72. 被引量：11
7刘海红,陈雪清.听力言语康复训练及其评估[J].国外医学（耳鼻咽喉科学分册）,2004,28(6):369-371. 被引量：1
8潘滔,马芙蓉,曹克利,宋为明,魏朝纲,崔玮兰.不同年龄人工耳蜗置入语前聋儿童元音基频和共振峰变化分析[J].临床耳鼻咽喉科杂志,2005,19(4):145-148. 被引量：7
9黄海亮,谢康林,杜平,吴边.一种高精度的基音提取方案[J].计算机工程,2004,30(B12):343-345. 被引量：4
10陈双籍,陈端石.基于心理声学参数的车内声品质偏好性评价[J].噪声与振动控制,2005,25(3):45-47. 被引量：36

引证文献16

1魏明果.方言比较的特征提取与矩阵分析[J].学术问题研究,2009,0(1):75-78.
2陈克安,马苗,张燕妮,王娜,闫靓.汉语语境下的车辆噪声听觉属性评价与分析[J].声学学报,2008,33(4):348-353. 被引量：14
3马斌,郭莉莉,韩中华,戴敬.基于DSP的语音识别系统的研究与设计[J].微计算机信息,2008,24(23):197-199. 被引量：11
4李宏言,黄申,王士进,梁家恩,徐波.基于GMM-UBM和GLDS-SVM的英文发音错误检测方法[J].自动化学报,2010,36(2):332-336. 被引量：3
5葛凤培,潘复平,董滨,颜永红.汉语发音质量评估的实验研究[J].声学学报,2010,35(2):261-266. 被引量：12
6王孟杰,孟子厚.基于参数距离的汉语普通话韵母决策树[J].电声技术,2010,34(3):40-42. 被引量：1
7王聪.基于SOPC的混叠语音降噪方法[J].江南大学学报（自然科学版）,2011,10(2):183-187. 被引量：1
8王士进,李宏言,柯登峰,李鹏,高鹏,徐波.面向第二语言学习的口语大规模智能评估技术研究[J].中文信息学报,2011,25(6):142-148. 被引量：7
9汤霖,彭土有,尹俊勋.普通话水平客观测试中的韵母测试研究[J].湘潭大学自然科学学报,2012,34(1):95-100. 被引量：3
10芦世丹,崔荣一.发音相似的朝鲜语和汉语单元音辨识方法[J].中文信息学报,2013,27(2):112-117. 被引量：1

二级引证文献64

1黄煜,陈克安,闫靓,吴群力.自适应分组成对比较法：原理及种子的选择[J].声学学报,2008,33(5):443-449. 被引量：11
2李战明,迟洋.基于DSP的说话人识别系统的设计[J].电子测量技术,2009,32(5):92-94. 被引量：2
3陈克安,王娜,王金昌.人耳辨识非语言声目标能力的实验研究[J].物理学报,2009,58(7):5075-5082. 被引量：11
4李东,郭维波,樊昌元,黄华.气象炮射检测系统设计[J].微计算机信息,2009,25(23):10-11. 被引量：6
5陈克安,陆晶,杨筱林,李冰.公园声景观感知属性维度数实验研究[J].噪声与振动控制,2009,29(4):132-137. 被引量：5
6王娜,陈克安,黄凰.水下噪声听觉属性的主观评价与分析[J].物理学报,2009,58(10):7330-7338. 被引量：12
7王娜,陈克安,黄凰.汉语语境下水下噪声听觉属性评价用语研究[J].噪声与振动控制,2009,29(5):170-175.
8李东,于如飞,黄华.气象炮射检测系统前端设计[J].通信技术,2009,42(11):203-205. 被引量：1
9蒲晓,杨勇.一个基于语音识别的盲人上网辅助系统的设计[J].微计算机信息,2010,26(4):171-173. 被引量：4
10王娜,陈克安.水下噪声音色属性回归模型及其在目标识别中的应用[J].物理学报,2010,59(4):2873-2881. 被引量：14

1王磊,张凡忠.网络摄像机的网络延迟及测试分析[J].中国安防,2014(4):76-80.
2陈立学,杨斌.热成像系统测试技术[J].红外与毫米波学报,1996,15(6):455-460. 被引量：4
3陈东,张艳,等.基于客观测试方法对普通放在的AMR话音激活检测算法性能分析[J].Journal of Beijing Institute of Technology,2002,11(2):174-179. 被引量：1
4王兵,游敏惠.MPEG-4在不同误码率下的性能仿真[J].重庆邮电学院学报（自然科学版）,2003,15(1):56-58. 被引量：2
5杨宗林,张治中.基于E-Model的VoIP语音质量测量[J].广东通信技术,2007,27(2):58-61. 被引量：1
6张齐.高清数字电视制作播出系统图像质量客观测试方法[J].辽宁广播电视技术,2015,0(3):73-75. 被引量：1
7符宁璐.粤语地区普通话学习韵母发音若干偏误问题分析[J].文教资料,2016(10):29-30. 被引量：1
8高清伦,谭月辉,王嘉祯.基于离散隐马尔科夫模型的语音识别技术[J].河北省科学院学报,2007,24(2):8-11. 被引量：4
9单卫,姚鸿勋,高文.唇读中序列口型的分类[J].中文信息学报,2002,16(1):31-36. 被引量：4
10殷玉喆,阚劲松,张继平,沙长涛.平板显示器运动图像清晰度客观测试技术研究[J].电视技术,2014,38(1):73-76.

声学学报

2007年第2期

浏览历史

内容加载中请稍等...

基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究被引量：16

参考文献14

二级参考文献39

共引文献54

同被引文献131

引证文献16

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究 被引量：16

参考文献14

二级参考文献39

共引文献54

同被引文献131

引证文献16

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究被引量：16