语音识别和说话人识别中各倒谱分量的相对重要性被引量：74

On the Importance of Components of the MFCC in Speech and Speaker Recognition

下载PDF

导出

摘要采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。 The analysis of the relative importance of components of MFCC for both speech recognition and speaker recognition using DTW recognizer in various noise environments are given.For English digit and under the Euclidean distance definition,the experiment results show cepstral components from C 2 to C 16 contain the most useful speaker information,while C 0 and C 1 are usually harm to speaker recognition.Cepstral terms from C 1 to C 12 are found to contain the most useful speech information.In both tasks,the additive noise decreases the relative importance of low MFCC terms faster than that of the middle and high MFCC terms,and the decrement depends on the speech SNR.The channel distortion will deteriorate low terms more than the middle and high MFCC terms in both tasks,also.

作者甄斌吴玺宏刘志敏迟惠生

机构地区北京大学信息科学中心

出处《北京大学学报（自然科学版）》 CAS CSCD 北大核心 2001年第3期371-378,共8页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家自然科学基金! (6 96 35 0 5 0 ) 北京市自然科学基金! (40 0 2 0 12 ) 高等学校骨干教师资助!计划资助项目

关键词 MFCC 说话人识别语音识别 MFCC speech recognition speaker recognition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1杨行峻迟惠生.数字语音信号处理[M].北京:电子工业出版社,1995..
2Zhen B，Proceedings ICSLP Ⅱ，2000年，933页
3杨行峻，数字语音信号处理，1995年

共引文献1

1桑恩方,叶松.水声语音通信中信源编码鲁棒性的研究[J].哈尔滨工程大学学报,2002,23(5):20-23.

同被引文献501

1刘泉,高庆.基于DWT的自适应盲音频水印算法[J].武汉理工大学学报,2008,30(1):95-97. 被引量：10
2王继祥.基于可变窗短时互相关特性的语音信号处理[J].仪器仪表学报,2006,27(z2):1381-1383. 被引量：1
3何存富,杭利军,吴斌.管道泄漏检测分布式光纤振动传感器研制[J].仪器仪表学报,2006,27(z2):1595-1597. 被引量：9
4王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
5WANG Shuo zhong School of Communication and Information Engineering, Shanghai University, Shanghai 200072, China.Watermarking Based on Principal Component Analysis[J].Advances in Manufacturing,2000(1):22-26. 被引量：10
6王文虎.四川口音普通话的语音特征[J].四川大学学报（哲学社会科学版）,1994(3):56-61. 被引量：7
7雷敏,杨榆.基于DWT-DCT-SVD的音频盲水印算法[J].北京邮电大学学报,2011,34(S1):51-54. 被引量：12
8岳倩倩,周萍,景新幸.基于非线性幂函数的听觉特征提取算法研究[J].微电子学与计算机,2015,32(6):163-166. 被引量：7
9艾伦,王陆,张鸽.汉语标准普通话水平训练和自动测试系统[J].中国电化教育,2004(7):78-80. 被引量：3
10成新民,沈律,赵力,邹采荣.基于修正EM算法的说话人识别的研究[J].电声技术,2004,28(12):51-53. 被引量：4

引证文献74

1王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11
2岳倩倩,周萍,景新幸.基于非线性幂函数的听觉特征提取算法研究[J].微电子学与计算机,2015,32(6):163-166. 被引量：7
3闫向宏,张亚萍,乔文孝.基于倒双谱的套管井声学评价系统特性辨识[J].应用声学,2005,24(4):250-254.
4李鹏怀,徐佩霞.基于DSP的嵌入式语音识别系统的实现[J].计算机工程,2005,31(16):160-162. 被引量：10
5崔双喜,朴春俊.噪声环境下的语音识别性能研究[J].计算机测量与控制,2005,13(11):1276-1278. 被引量：11
6马军,杨苹.一种聚焦式模糊分段算法及其在语音识别中的应用[J].科技资讯,2006,4(7):2-4.
7白莹,赵振东,戚银城,王斌,郭建勇.基于小波神经网络的与文本无关说话人识别方法研究[J].电子与信息学报,2006,28(6):1036-1039. 被引量：7
8贺志阳,张玲华.基于GMM统计参数和SVM的说话人辨认研究[J].南京邮电大学学报（自然科学版）,2006,26(3):78-82. 被引量：2
9王书诏,邱天爽.与文本无关的说话人识别系统的设计[J].电声技术,2006,30(12):51-52. 被引量：1
10王书诏,邱天爽.说话人识别研究综述[J].电声技术,2007,31(1):51-55. 被引量：10

二级引证文献575

1韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：12
2侯秉捷.基于matlab的语音信号识别设计[J].中国新通信,2020,0(3):90-90. 被引量：1
3郭爱军.基于ELM-VPMCD的输送带超声缺陷识别分析[J].工矿自动化,2024,50(S01):11-14.
4艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：14
5崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：8
6吕义付,张乾,徐艳.基于BEDU-Net算法的皮肤病灶分割研究[J].智能计算机与应用,2023,13(8):73-79. 被引量：1
7江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：7
8张重远,罗世豪,岳浩天,王博闻,刘云鹏.基于Mel时频谱-卷积神经网络的变压器铁芯声纹模式识别方法[J].高电压技术,2020,46(2):413-423. 被引量：82
9薛继良,尚振宏.VoIP技术在智能小区可视对讲系统中的应用研究[J].云南大学学报（自然科学版）,2008,30(S2):223-225.
10王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11

1余锡权.浅论层次分析法在无线电频谱资源分配中的应用[J].中国无线电,2005(9):6-9. 被引量：1
2陈勇,胡爱群,胡啸.通信网中节点重要性的评价方法[J].通信学报,2004,25(8):129-134. 被引量：92
3陈庆利,韦元军,李坚石.人工合成噪声环境下的连续英文数字识别系统[J].贵州大学学报（自然科学版）,2006,23(2):171-174.
4孙德印.新科HD7V-420液晶彩电电源与保护电路原理与维修(四)[J].家电检修技术,2010(8):6-8.
5孟大渭,张秀梅,刘毅,樊爱龙.OFDM与MC-CDMA技术在电力线通信中的应用比较[J].辽宁工业大学学报（自然科学版）,2008,28(1):13-16.
6任天平,门茂琛.语音识别技术应用的进展[J].河南科技,2005,24(2):19-20. 被引量：6
7金波,徐俊.ASON网络中的相对性保护策略[J].光通信技术,2009,33(3):28-30.
8余卫平.FRS家用对讲机的原理、调试与维修(三)[J].家庭电子,2005(03X):42-43.
9杜娟.中兴通讯全球CDMA无线用户容量逾5000万线[J].通信世界,2006(47A):6-6.
10张品,陈磊,姜亚光.无线网络中节点重要性的研究[J].电子器件,2011,34(4):395-397. 被引量：3

北京大学学报（自然科学版）

2001年第3期

浏览历史

内容加载中请稍等...

语音识别和说话人识别中各倒谱分量的相对重要性被引量：74

参考文献3

共引文献1

同被引文献501

引证文献74

二级引证文献575

相关作者

相关机构

相关主题

浏览历史

语音识别和说话人识别中各倒谱分量的相对重要性 被引量：74

参考文献3

共引文献1

同被引文献501

引证文献74

二级引证文献575

相关作者

相关机构

相关主题

浏览历史

语音识别和说话人识别中各倒谱分量的相对重要性被引量：74