噪声自适应的多数据流复合子带语音识别方法被引量：3

Noise Adaptive Multi-stream Hybrid Sub-band Approach for Robust Speech Recognition

下载PDF

导出

摘要首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中;然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。 This paper first proposes a new method for evaluating the reliability of cepstral components and extends the marginalisation technique to cepstral recognizers. Then a noise adaptive multi-stream hybrid sub-band approach is proposed for robust speech recognition by making use of the complemental performances between full-band and sub-band cepstral marginalisation recognizers in different noises. Experimental results show that the proposed approach can turn to the less distorted data stream automatically and improve the robustness of the speech recognizer in various noisy environments effectively.

作者张军韦岗

机构地区华南理工大学电信学院

出处《电子与信息学报》 EI CSCD 北大核心 2006年第7期1183-1187,共5页 Journal of Electronics & Information Technology

基金国家自然科学青年基金(60502041) 广东省自然科学博士启动基金(65300146)资助课题

关键词语音识别丢失数据边缘化多数据流复合子带 Speech recognition, Missing data, Marginalisation, Multi-stream, Hybrid sub-band

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1Cooke M, Green P, Josifovski L, Vizinho A. Robust automatic speech recognition with missing and unreliable acoustic data.Speech Communication, 2001, 34(3): 267 - 285.
2罗宇,杜利民.基于隐马尔可夫模型局部最优状态路径的数据重建算法[J].电子与信息学报,2004,26(5):722-726. 被引量：8
3PalomAAkim K J, Brown G J, Wang D L. A binaural processor for missing data speech recognition in the presence of noise and small-room reverberation. Speech Communication, 2004, 43(4):361 - 378
4Veth J, Cranen B, Boves L. Acoustic backing-off as an implementation of missing feature theory. Speech Communication, 2001, 34(3): 247-256.
5Okawa S, Bocchieri E, Potamianos A. Multi-band speech recognition in noisy environments. IEEE International Conference on Acoustics, Speech, and Signal Processing,Seattle ,Washington USA, May 12-15, 1998: 641-644.
6Hariharan R, Kiss I, Viikki O. Noise robust speech parameterization using multiresolution feature extraction. IEEE Trans. on Speech and Audio Processing, 2001, 9(8): 856 - 865.
7Huerta J, Stem R. Speech recognition from GSM codec parameters. International Conference on Spoken Language Processsing, Sydney , Australia, November 30-December 4,1998, 4.. 1463- 1466.
8蒋文建,韦岗.噪声下差分复合子带语音识别方法[J].通信学报,2002,23(1):18-24. 被引量：4
9Young S, Kershaw D, Odell J, et al.. The HTK Book (for HTK version 3.1). Cambridge, UK: Cambridge University Tech Services Ltd, 2001.

二级参考文献10

1Morris A C, Cooke M, Green P. Some solutions to the missing feature problem in data classification, with application to noise robust ASR. Proc. ICASSP'98, Seattle, 1998: 737-740.
2Vizinho A, Green P, Cooke M, Josifovski L. Missing data theory, spectral subtraction and signalto-noise estimation for robust ASR: An integrated study. Eurospeech'99, Budapest, 1999, vol.5:2407-2410.
3Cooke M, Green P, Josifovski L, Vizinho A. Robust automatic speech recognition with missing and unreliable acoustic data. Speech Communication, 2001, 34(3): 267-285.
4Raj B, Seltzer M, Stern R. Reconstruction of damaged spectrographic features for robust speech recognition. In Proceedings ICSLP'00, Beijing, China, October 2000, vol.1: 375-360.
5Raj B. Reconstruction of incomplete spectrograms for robust speech recognition. [Ph.D Thesis],ECE Department, Carnegie Mellon University, April, 2000.
6Rabiner L R, Juang B H. Fundamentals of Speech Recognition. Prentice-Hall Press, 1993, Ch.6:321-389.
7Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland. The HTK Book (for HTK Version 3.0), Microsoft Corporation, 2000.
8韦晓东,朱杰,胡光锐.汽车噪声中自动语音的识别技术[J].上海交通大学学报,1998,32(10):10-13. 被引量：6
9刘加.汉语大词汇量连续语音识别系统研究进展[J].电子学报,2000,28(1):85-91. 被引量：51
10蒋文建,韦岗.基于掩蔽特性的噪声环境下语音识别新特征[J].声学学报,2001,26(6):516-520. 被引量：10

共引文献10

1杜艺卓,蒋静.隐马尔可夫模型在公安边防信息化工作中的应用[J].中国经贸导刊,2019,0(2Z):123-125.
2张军,章熙春,曹燕,韦岗.一种基于模糊规则的鲁棒语音识别方法[J].电路与系统学报,2006,11(5):96-100.
3张军,韦岗,余华.基于特征分量输出概率加权的多数据流鲁棒语音识别方法[J].声学学报,2008,33(2):102-108. 被引量：2
4ZHANG Jun WEI Gang YU Hua NING Genxin.Robust multi-stream speech recognition based on weighting the output probabilities of feature components[J].Chinese Journal of Acoustics,2009,28(3):269-279. 被引量：4
5冯涛,郭云飞,黄开枝,吉江.基于隐马尔可夫模型的行为轨迹还原算法[J].计算机工程,2012,38(18):1-5. 被引量：8
6黄岗.马尔可夫及隐马尔可夫模型的应用[J].电子设计工程,2013,21(17):60-62. 被引量：8
7曲大成,房振明.基于隐马尔科夫模型的波动率预测探究[J].电子设计工程,2014,22(18):1-3. 被引量：4
8徐广根,杨璐,严建峰,徐彩旭,石鸿斌.基于LDA主题模型的用户电信轨迹恢复算法[J].计算机应用研究,2019,36(8):2266-2270.
9张静,程艳.基于隐马尔可夫模型的智能物流路径优化[J].物流科技,2025,48(6):5-8. 被引量：1
10覃爱娜,韩华.说话人识别技术及其在工厂自动控制系统中的应用[J].长沙电力学院学报（自然科学版）,2003,18(2):68-70. 被引量：1

同被引文献24

1谢磊,付中华,蒋冬梅,赵荣椿,Werner Verhelst,Hichem Sahli,Jan Conlenis.一种稳健的基于VisemicLDA的口形动态特征及听视觉语音识别[J].电子与信息学报,2005,27(1):64-68. 被引量：4
2邱政权,尹俊勋,薛丽萍.基于DWT-TEO的说话人识别[J].自动化学报,2006,32(5):753-759. 被引量：5
3赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
4李斌,钟润添,王先基,庄镇泉.一种基于递增估计GMM的连续优化算法[J].计算机学报,2007,30(6):979-985. 被引量：9
5刘明,袁保宗,苗振江,唐晓芳.基于模糊规则的多分类器融合[J].电子与信息学报,2007,29(7):1707-1712. 被引量：4
6Hermansky H, Morgan N. RASTA processing of speech[J]. IEEE Transactions on Speech and Audio Processing, 1994, 2(4):578-589.
7Kosaka T, Yamamoto H, Yamada M,et al. Instantaneous environment adaptation techniques based on fast PMC and MAP-CMS methods[C]. Proceedings of the 1998 IEEE Intemational Conference on Acoustics, Speech, and Signal Processing, 1998, 2: 789-792.
8Ding Guo-Hong, Li Chengrong, Xu Bo. Comparison of MLLR and CDCN for speech recognition in additive noise by experiments[C]. ISCSLP, 2002.
9Young S et al. The HTK Book (for HTK version 3.1). Cambridge University Tech Services Ltd, 2001
10Lim W, Kim N S. Feature compensation incorporating modeling error statistics. IEEE Signal Processing Letters, 2007; 14(7): 492-495

引证文献3

1张军,韦岗,余华.基于特征分量输出概率加权的多数据流鲁棒语音识别方法[J].声学学报,2008,33(2):102-108. 被引量：2
2ZHANG Jun WEI Gang YU Hua NING Genxin.Robust multi-stream speech recognition based on weighting the output probabilities of feature components[J].Chinese Journal of Acoustics,2009,28(3):269-279. 被引量：4
3邱政权,范小春,王俊年.基于维纳滤波和子带处理的说话人识别[J].声学与电子工程,2010(2):41-43.

二级引证文献6

1魏勋,耿志辉,王晓攀.语音识别的鲁棒性特征提取方法研究[J].无线电工程,2010,40(8):59-61. 被引量：1
2高美娟,杨智鑫,田景文.移动机器人实时语音控制的实现[J].电子测量技术,2011,34(7):50-53. 被引量：12
3黄永明,章国宝,董飞,李悦.层叠式“产生/判别”混合模型的语音情感识别[J].声学学报,2013,38(2):231-240. 被引量：3
4侯雷静,郭婷婷,孙燕,齐英杰,应冬文,唐闽,颜永红.面向心音分割的个性化高斯混合建模方法[J].声学学报,2019,44(1):20-27. 被引量：9
5曾霞霞,徐戈,吴征远.基于MFCC特征组合参数的说话人识别研究[J].集美大学学报（自然科学版）,2016,21(4):317-320. 被引量：3
6赵峰,徐海青,吴立刚,余江斌,黄影.基于后验知识监督的噪声鲁棒声学模型研究[J].湘潭大学学报（自然科学版）,2018,40(6):98-103.

1张军,韦岗,余华.基于特征分量输出概率加权的多数据流鲁棒语音识别方法[J].声学学报,2008,33(2):102-108. 被引量：2
2缴春芳,尹业安,梁玉营.基于MFCC和BP神经网络的说话人识别研究[J].网友世界,2013(4):37-37.
3唐爱平.采用噪声自适应正则化的图像重建的仿真研究[J].电脑开发与应用,2012,25(9):24-26.
4杨栋,尹义龙,朱明英,曹庆峰.一种大噪声自适应的角点检测技术[J].南京大学学报（自然科学版）,2008,44(2):140-147. 被引量：2
5何彬,柳平,王琦,程行甫,韩林呈.基于多特征的语音端点检测技术研究[J].通信技术,2010,43(11):139-141. 被引量：3
6孔祥阳.分块噪声自适应高光谱图像去噪算法研究[J].井冈山大学学报（自然科学版）,2016,37(1):69-74. 被引量：2
7孙永军,王福明.自适应模糊神经网络在噪声消除中的应用[J].微计算机信息,2007,23(05S):312-314. 被引量：2
8王彪,杨志明,杨小东,黄海宁,田杰.基于倒谱特征的舰船辐射噪声识别算法研究[J].西北师范大学学报（自然科学版）,2006,42(6):34-35.
9徐少平,杨荣昌,刘小平.基于噪声估计的自适应开关型中值滤波器[J].光电子．激光,2014,25(4):792-800. 被引量：8
10唐永锋,霍春宝.噪声环境下语音信号端点检测算法的研究与改进[J].电脑知识与技术,2007(6):1386-1387. 被引量：1

电子与信息学报

2006年第7期

浏览历史

内容加载中请稍等...

噪声自适应的多数据流复合子带语音识别方法被引量：3

参考文献9

二级参考文献10

共引文献10

同被引文献24

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

噪声自适应的多数据流复合子带语音识别方法 被引量：3

参考文献9

二级参考文献10

共引文献10

同被引文献24

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

噪声自适应的多数据流复合子带语音识别方法被引量：3