期刊文献+

语音识别和说话人识别中各倒谱分量的相对重要性 被引量:74

On the Importance of Components of the MFCC in Speech and Speaker Recognition
在线阅读 下载PDF
导出
摘要 采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。 The analysis of the relative importance of components of MFCC for both speech recognition and speaker recognition using DTW recognizer in various noise environments are given.For English digit and under the Euclidean distance definition,the experiment results show cepstral components from C 2 to C 16 contain the most useful speaker information,while C 0 and C 1 are usually harm to speaker recognition.Cepstral terms from C 1 to C 12 are found to contain the most useful speech information.In both tasks,the additive noise decreases the relative importance of low MFCC terms faster than that of the middle and high MFCC terms,and the decrement depends on the speech SNR.The channel distortion will deteriorate low terms more than the middle and high MFCC terms in both tasks,also.
出处 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期371-378,共8页 Acta Scientiarum Naturalium Universitatis Pekinensis
基金 国家自然科学基金! (6 96 35 0 5 0 ) 北京市自然科学基金! (40 0 2 0 12 ) 高等学校骨干教师资助!计划资助项目
关键词 MFCC 说话人识别 语音识别 MFCC speech recognition speaker recognition
  • 相关文献

参考文献3

  • 1杨行峻 迟惠生.数字语音信号处理[M].北京:电子工业出版社,1995..
  • 2Zhen B,Proceedings ICSLP Ⅱ,2000年,933页
  • 3杨行峻,数字语音信号处理,1995年

共引文献1

同被引文献501

引证文献74

二级引证文献575

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部