基于模糊多类支持向量机的语音质量客观评价被引量：3

Objective Speech Quality Evaluation Based on Fuzzy Multi-Class Support Vector Machine

下载PDF

导出

摘要提出了采用模糊有向图支持向量机(FDGSVM)对基于输出的多语言语音样本进行语音质量评价的一种新方法.将多个可进行两类分类的模糊支持向量机组织成具有惟一根节点的有向图结构,得到多类分类器FDGSVM;提取待测语音信号的Mel倒谱系数并将其作为特征向量,再通过FDGSVM将特征向量映射到非线性划分的主观平均意见评分(MOS)区间,映射值即为输出的语音质量的客观评价结果.实验结果表明,所提算法获得的评测结果与主观MOS评价之间的相关度,在闭集测试时可达0.91,在开集测试时可达0.88. A novel approach to output-based speech quality evaluation using fuzzy directed graph support vector machine （FDGSVM） is proposed. Binary classifiers of fuzzy support vector machine are organized into a structure of directed graph with a unique root to form the multi-classifier FDGSVM. Mel cepstrum coefficients are extracted from multi-lingual speech samples and regarded as eigenvectors, and mapped to different non-linear partition of subjective mean opinion score （MOS） through FDGSVM. The mapped scores are the out-based speech quality evaluation results. Experimental results show that the correlation between the result of the proposed approach and MOS is up to 0. 91 in close-set test and 0.88 in open set test.

作者张军张德运傅鹏

机构地区西安交通大学电子与信息工程学院

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第2期199-202,共4页 Journal of Xi'an Jiaotong University

基金国家高技术研究发展计划资助项目(2003AA148010)

关键词模糊有向图支持向量机 MEL倒谱系数语音质量客观评价 fuzzy directed graph support vector machine Mel-cepstrum coefficient speech quality objective evaluation

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1ITU-T Rec.G.107-1998,The E-model:a computational model for use in transmission planning [S].
2Takahashi A.Opinion model for estimating conversational quality of VOIP [A].International Conference on Acoustics,Speech,and Signal Processing [C].Montreal,Canada:IEEE,2004.1072-1075.
3Kim D S,Tarraf A.Perceptual model for non-intrusive speech quality assessment [A].International Conference on Acoustics,Speech,and Signal Processing [C].Montreal,Canada:IEEE,2004.1060-1063.
4Davies S B,Mermelstein P.Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences [J].IEEE Trans Acoustics,Speech,and Signal Processing,1980,28 (4):357-366.
5Vapnik V N.Statistical learning theory [M].New York:Wiley,1998.
6Lin Chunfu,Wang Shengde.Fuzzy support vector machines [J].IEEE Trans Neural Networks,2002,13(2):464-471.
7Hsu Chihwei,Lin Chihjen.A comparison of methods for multiclass support vector machines [J].IEEE Trans on Neural Networks,2002,13(2):415-425.
8Mozer M,Jordan M,Petsche T.Advances in neural information processing systems [M].Cambridge,USA:MIT Press,2000.547-553.
9ITU-T P 23-1998,ITU-T coded-speech database [S].

同被引文献18

1张若英,孟洛明,邱雪松.支持多业务等级的NGI IP-VPN业务质量评价体系[J].北京邮电大学学报,2004,27(6):21-25. 被引量：8
2徐秉铮,邱伟.汉语普通话声母的分类与识别[J].中文信息学报,1993,7(1):33-39. 被引量：5
3杨俊,谢寿生.基于模糊支持向量机的飞机飞行动作识别[J].航空学报,2005,26(6):738-742. 被引量：28
4裴学华,许磊,李朝峰.边缘效应训练的模糊支持向量机及应用[J].微计算机信息,2006(06S):254-255. 被引量：1
5林闯,雷蕾.下一代互联网体系结构研究[J].计算机学报,2007,30(5):693-711. 被引量：65
6Liorente J I, Vilda G P. Automatic Detection of Voice Im: pairments by Means of Short Term Cepstral Parameters and Neural Network Based Detectors[J]. IEEE Trans on Bio-medical Engineering, 2004, 51(2):380 -384.
7Hsu Chihwei, Lin Chihjen. A Comparison of Methods for Multi-Class Support Vector Machines[J]. IEEE Trans on Neural Networks, 2002, 17,(2):415-425.
8于振亚,王闻侠,潘丰.模糊支持向量机在青霉素发酵中的应用[J].微计算机信息,2007,23(19):300-302. 被引量：7
9朱海萍,李增智,陈妍.一种细粒度的区分服务及QoS映射优化研究[J].小型微型计算机系统,2007,28(12):2125-2128. 被引量：1
10祁立,刘玉树.基于两阶段聚类的模糊支持向量机[J].计算机工程,2008,34(1):4-6. 被引量：5

引证文献3

1朱海萍,李增智,王云岚,夏虹.可变粒度的业务质量评价模型及其算法研究[J].小型微型计算机系统,2008,29(8):1400-1404. 被引量：3
2蔡磊,戴革林,袁德国,袁冬根.机场未爆弹识别技术应用研究[J].微计算机信息,2009,25(10):274-275.
3赵剑辉,凌卫新,陈卓铭,何敏聪,欧阳静明.基于模糊多类支持向量机的声母识别方法[J].计算机工程与科学,2011,33(5):160-164. 被引量：3

二级引证文献6

1田俊峰,田瑞,杨李丹,李超.基于商品领域的P2P电子商务细粒度信任模型[J].高技术通讯,2010,20(4):371-378. 被引量：2
2陈翔,吴润泽,曹敏,丁雷.基于模糊AHP的电力ICT网络业务质量评价方法[J].电力系统通信,2011,32(6):48-52. 被引量：6
3陈卓铭.汉语语言心理加工与失语症评估[J].中国康复医学杂志,2015,30(11):1091-1094. 被引量：13
4覃朗,朱建军.基于超立方体顶点采样的区间数SVM分类模型研究[J].计算机工程与科学,2017,39(11):2131-2138.
5仇建军,许林,宁达.舰船通信业务QoS评估模型设计[J].舰船电子工程,2017,37(5):17-19. 被引量：1
6运动性构音障碍的分类与评估专家共识组,陈卓铭,席艳玲,王刚.运动性构音障碍的分类与评估专家共识[J].中华物理医学与康复杂志,2025,47(10):865-873.

1李薇,胡智奇,尚秋峰,戚银城.语音质量客观评价方法的研究[J].电力系统通信,2009,30(4):64-67. 被引量：11
2陈国,胡修林,张蕴玉,朱耀庭.语音质量客观评价方法研究进展[J].电子学报,2001,29(4):548-552. 被引量：51
3张文红,韩刚,李建东.基于支撑矢量机的通信信号调制识别方法研究[J].通信技术,2003,36(2):12-14. 被引量：4
4赵春晖,陈万海,万建.一种改进的多类支持向量机超光谱图像分类方法[J].智能系统学报,2008,3(1):77-82. 被引量：1
5赵剑辉,凌卫新,陈卓铭,何敏聪,欧阳静明.基于模糊多类支持向量机的声母识别方法[J].计算机工程与科学,2011,33(5):160-164. 被引量：3
6周欣,吴瑛,张弛.基于高阶累积量和支持向量机的信号调制分类[J].信息工程大学学报,2009,10(4):466-470. 被引量：6
7凌渝.基于PESQ算法的语音质量客观评价方法研究[J].警察技术,2011(5):30-32. 被引量：6
8孙建成,张太镒,刘枫.基于支持向量机的多类数字调制方式自动识别算法[J].西安交通大学学报,2004,38(6):619-622. 被引量：11
9孙建成,张太镒,刘海员.基于SVM的多类模拟调制方式识别算法[J].电子科技大学学报,2006,35(2):149-152. 被引量：6
10韩钢,张文红,李建东,陈彦辉.基于高阶累积量和支撑矢量机的调制识别研究[J].系统工程与电子技术,2003,25(8):1007-1011. 被引量：20

西安交通大学学报

2006年第2期

浏览历史

内容加载中请稍等...

基于模糊多类支持向量机的语音质量客观评价被引量：3

参考文献9

同被引文献18

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于模糊多类支持向量机的语音质量客观评价 被引量：3

参考文献9

同被引文献18

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于模糊多类支持向量机的语音质量客观评价被引量：3