基于MDT特征补偿的噪声鲁棒语音识别算法被引量：2

Robust noise feature compensation method for speech recognition based on missing data technology

导出

摘要针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。 The performance of automatic speech recognition systems declines dramatically in noisy environments.This paper presents a missing data technology（MDT） feature compensation method based on a time-frequency correlation（TF-CBFC） to improve the speech recognition.This method first estimates the missing data masks and then divides the spectrogram into time-frequency blocks（TFBs）.Clusters of the TFBs are used to compensate for missing data in the Mel spectrogram of noisy speech.Tests with the HTK tools on the TIDIGITS database using different classes of noise show that this method outperforms the MDT feature compensation method based on the spectral relations for various signal to noise ratios（SNRs）.

作者胡旭琰邹月娴王文敏

机构地区北京大学信息工程学院

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第6期753-756,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金项目(61271309)

关键词语音识别缺失数据技术隐Markov模型(HMM) 特征补偿 speech recognition missing data technology hidden Markov model（HMM） feature compensation

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献13

1Cooke M, Green P, Crawford M D. Handling missing data in speech recognition[C]//Proc ICSLP. Yokohama, Japan: IEEE Press, 1994:1555 - 1558.
2Hermansky H. Perceptual linear predictive (PLP) analysis of speech [J]. Journal of the Acoustical Society of America, 1990, 87:1738-1752.
3Gales M J F, Young S J. Robust continuous speech recognition using parallel model combination [J]. IEEE Transactions on Speech and Audio Processing,, 1996, 4(5) : 352 -359.
4Moreno P J, Raj B, Stern R M. A vector Taylor series approach for environment independent speech recognition [C]//Proc ICASSP. Atlanta, GA, USA.- IEEE Press, 1996(2) ~ 73:3-736.
5Cooke M, Green P, Josifovski L, et al. Robust automatic speech recognition with missing and unreliable acoustic data [J]. Speech Communication, 2001, 34(3) : 267 - 285.
6Vizinho A, Green P, Cooke M, et al. Missing data theory, spectral subtraction and signal-to-noise estimation for robust ASR: An integrated study [C]// Proc Eurospeech. Budapest, Hungary, 1999:2407- 2410.
7Seltzer M L, Raj B, Stern R M. A Bayesian classifier for spectrographic mask estimation for missing feature speech recognition [J]. Speech Communication, 2004, 43(4): 379-393.
8Raj B, Seltzer M L, Stern R M. Reconstruction of missing features for robust speech recognition [J]. Speech Communication, 2004, 43(4) : 275 - 296.
9Raj B, Stern R M. Missing-feature approaches in speech recognition [J]. Signal Processing Magazine, IEEE , 2005, 22(5) :101 - 116.
10Raj B, Seltzer M L, Stern R M. Robust speech recognition: The case for restoring missing features[C]//Proc Eurospeech: The Workshop on Consistent and Reliable Acoustic Cues. Aalborg, Denmark, 2001.

同被引文献10

1齐志泉,田英杰,徐志洁.支持向量机中的核参数选择问题[J].控制工程,2005,12(4):379-381. 被引量：39
2蔡尚,金鑫,高圣翔,潘接林,颜永红.用于噪声鲁棒性语音识别的子带能量规整感知线性预测系数[J].声学学报,2012,37(6):667-672. 被引量：15
3谢阳,张燕,李改红,马梁.基于Virtools的虚拟现实系统建模与优化[J].微处理机,2013,34(1):92-95. 被引量：6
4顾育嘉,洪旸,胡爱群.基于DWT变换的语音信息隐藏技术研究[J].电气电子教学学报,2013,35(6):42-45. 被引量：2
5刘保卫.虚拟现实场景的建模特点及生成效果[J].计算机工程与应用,2014,50(5):137-141. 被引量：12
6马莎莎,戴曙光,穆平安.基于短时能量的循环AMDF基音检测算法[J].计算机仿真,2014,31(7):278-282. 被引量：10
7晁浩,宋成,彭维平.基于发音特征的声效相关鲁棒语音识别算法[J].计算机应用,2015,35(1):257-261. 被引量：8
8米川,白俊贤.基于线性预测分析的语音信号合成[J].通信电源技术,2014,31(6):80-82. 被引量：2
9林晓丹.采用线性预测模型的语音篡改检测[J].华侨大学学报（自然科学版）,2015,36(1):40-44. 被引量：2
10孙颖,姚慧,张雪英,张奇萍.基于混沌特性的情感语音特征提取[J].天津大学学报（自然科学与工程技术版）,2015,48(8):681-685. 被引量：13

引证文献2

1吴为胜,张良,李磊.虚拟场景中篡改语音检测方法的研究[J].计算机仿真,2016,33(7):418-422. 被引量：2
2易江燕,陶建华,刘斌,温正棋.基于迁移学习的噪声鲁棒语音识别声学建模[J].清华大学学报（自然科学版）,2018,58(1):55-60. 被引量：5

二级引证文献7

1李向明.分布式网络信息数据防篡改方法研究[J].计算机测量与控制,2017,25(9):262-265. 被引量：6
2杨斌.足球比赛视频中的目标检测与跟踪算法研究[J].计算机测量与控制,2017,25(9):266-268. 被引量：4
3米婧.英语语音优化识别建模仿真分析[J].信息技术,2019,43(6):91-95. 被引量：6
4张威,刘晨,费鸿博,李巍,俞经虎,曹毅.基于DL-T及迁移学习的语音识别研究[J].工程科学学报,2021,43(3):433-441. 被引量：10
5曹毅,黄子龙,盛永健,刘晨,费鸿博.D-2-DenseNet噪音鲁棒的城市音频分类模型[J].北京邮电大学学报,2021,44(1):86-91. 被引量：2
6张允耀,黄鹤鸣,张会云.复杂噪声环境下语音识别研究[J].计算机与现代化,2021(9):68-74. 被引量：5
7费鸿博,吴伟官,李平,曹毅.基于梅尔频谱分离和LSCNet的声学场景分类方法[J].哈尔滨工业大学学报,2022,54(5):124-130. 被引量：8

1刘立东,宋焕生,靳钊.基于混沌同步的噪声鲁棒测距方法[J].电讯技术,2014,54(1):46-51. 被引量：3
2雷建军,杨震,刘刚,郭军.噪声鲁棒语音识别研究综述[J].计算机应用研究,2009,26(4):1210-1216. 被引量：15
3刘金梅,王国宇.一种基于块划分颜色特征的图像检索方法[J].中国海洋大学学报（自然科学版）,2005,35(2):330-334. 被引量：2
4邱作春.麦克风阵列语音增强用于抗噪说话人识别[J].大众科技,2008,10(12):35-37.
5何勇军,付茂国,孙广路.语音特征增强方法综述[J].哈尔滨理工大学学报,2014,19(2):19-25. 被引量：3
6许可.VoLTE语音质量评价方法及测试方案[J].电信网技术,2014(5):81-84. 被引量：23
7吕勇,吴镇扬.基于矢量泰勒级数的鲁棒语音识别[J].天津大学学报,2011,44(3):261-265. 被引量：4
8尹海明,王金明,李欢欢.基于信噪比估计的说话人识别前端处理[J].军事通信技术,2014,35(4):43-48.
9吴海洋,杨飞然,周琳,吴镇扬.矢量泰勒级数特征补偿的说话人识别[J].声学学报,2013,38(1):105-112. 被引量：6
10吕晶晶,陈娟,张培,马艳娥.基于VQ的语音识别技术研究[J].伺服控制,2011(4):68-69. 被引量：1

清华大学学报（自然科学版）

2013年第6期

浏览历史

内容加载中请稍等...

基于MDT特征补偿的噪声鲁棒语音识别算法被引量：2

参考文献13

同被引文献10

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于MDT特征补偿的噪声鲁棒语音识别算法 被引量：2

参考文献13

同被引文献10

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于MDT特征补偿的噪声鲁棒语音识别算法被引量：2