基于DNN的子空间语音增强算法被引量：2

A Speech Enhancement Method Based on Deep Neural Network and Subspace Algorithm

下载PDF

导出

摘要针对噪声的随机性和突变性,使得传统算法抑制非平稳噪声比抑制平稳噪声难度增大的问题,提出了一种基于深度神经网络的子空间语音增强算法。该算法利用带噪的语音信号数据训练一组深度神经网络语音生成型模型(DNN训练模型);在测试增强阶段根据噪声估计和DNN模型去除非平稳噪声;最后,通过信号子空间在抑制噪声和减少信号失真上做出较为折中的选择重构语音信号。实验结果表明,基于深度神经网络的子空间语音增强算法对非平稳噪声有非常强的抑制能力,通过STOI和PESQ值反映了在低信噪比下,该算法可以提高增强语音的可懂度。 The random and abrupt nature of noise makes the traditional algorithm more difficult to suppress non-stationary noise than stationary noise.To solve above problems,a speech enhancement method based on Deep Neural Network and subspace algorithm was proposed.First,the algorithm uses speech signal with noise to train a set of speech production model by deep neural network（DNN training model）.Second,in the test of the enhancement noise estimation and DNN model are used to remove non-stationary noise.Finally,the signal subspace in suppressing noise and reducing the signal distortion makes a more eclectic choice of speech signal reconstruction.The simulation results show that the improved algorithm based on speech enhancement can remove non-stationary noise strongly and improve the intelligibility of enhanced speech by STOI under low SNR.

作者贾海蓉王栋郭欣

机构地区太原理工大学信息工程学院

出处《太原理工大学学报》 CAS 北大核心 2016年第5期647-650,679,共5页 Journal of Taiyuan University of Technology

基金国家自然基金项目资助:基于认知机理的情感语音识别基础研究(61370093) 山西省青年科技研究基金资助项目(2013021016-1) 山西省自然科学基金资助项目(2013011016-1) 校基金团队资助项目(2014TD028 2014TD029)

关键词语音增强信号子空间深度神经网络非平稳噪声噪声估计 speech enhancement subspace deep neural network non-stationary noise noise estimation

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1杨立春,叶敏超,钱沄涛.基于多任务稀疏表达的二元麦克风小阵列话音增强算法[J].通信学报,2014,35(2):87-94. 被引量：3
2张培玲,刘桥,刘宇红.基于小波变换的双通道语音增强[J].贵州大学学报（自然科学版）,2004,21(2):140-143. 被引量：2
3XU Yong,DU Jun, DAI Lirong, et al. A regression approach to speech enhancement based on deep neural networks[J]. Transactions on Audio, Speech, and Language Processing, 2015,23 ( 1 ) : 7-19.
4SURENDRAN,KUMAR. Perceptual subspace speech enhancement with variance normalization[J]. Procedia Computer Sci- ence, 2015,54 : 818-828.
5YE Tongbao. A higher order subspace algorithm for multichannel speech enhancement[J]. IEEE Signal Processing Letters, 2015,22(11) :2004-2008.
6冯畅.正线性函数在深度神经网络中的研究[J].计算机工程与设计,2015,36(3):759-762. 被引量：3
7OKUTOMI TANAKA. A novel inference of a restricted boltzmann machine[C]//IEEE,STOCKHOLM. 22nd International Conference on. SWEDEN. Pattern Recognition (ICPR). 2014 : 1526-1537.
8赵彩光,张树群,雷兆宜.基于改进对比散度的GRBM语音识别[J].计算机工程,2015,41(5):213-218. 被引量：4

二级参考文献40

1郑宏兴姚纪欢张成.MATLAB 5.X工具箱使用技巧与实例[M].武昌:华中科技大学出版社,chapter4,2001..
2飞思科技产品研法中心.MATLAB 6.5辅助小波分析与应用[M].北京:电子工业出版社,chapter6,2003..
3杨福生.小波变换的工程分析与应用[M].北京：科学出版社,2000..
4Ebert T, Banfer O, Nelles O. Multilayer perceptron network with modified sigmoid activation functions [G]. LNCS 6319: Artificial Intelligence and Computational Intelligence. Berlin: Springer Berlin Heidelberg, 2010: 414-421.
5Karlik B, Olgae AV. Performance analysis of various activa- tion functions in generalized MLP architectures of neural net- works [J]. International Journal of Artificial Intelligence and Expert Systems, 2010, 1 (4): 111-122.
6Glorot X, Bordes A, Bengio Y. Domain adaptation for large-scalesentiment classification: A deep learning approach [C] //Proceedings of the 28th International Conference on Machine Learning, 2011.
7Glorot X, Bengio Y. Understanding the difficulty of training deep feedforward neural networks [C] //Proceedings of the International Conference on Artificial Intelligence and Statistics, 2010.
8Graves A, Mohamed AR, Hinton G. Speech recognition with deep recurrent neural networks [C] //IEEE International Con- ference on Acoustics, Speech and Signal Processing, 2013.
9Pradhan 13, Lee S. Regional landslide susceptibility analysis using back-propagation neural network model at Cameron High- land, Malaysia [J]. Landslides, 2010, 7 (1): 13-30.
10Vincent P, Larochelle H, Lajoie I, et al. Stacked denoising autoencoders: Learning useful representations in a deep net- work with a local denoising criterion [J]. The Journal of Ma- chine LearningResearch, 2010, 11; 3371-3408.

共引文献8

1刘波,聂明新,向俊涛.基于小波分析的阈值语音信号去噪研究[J].现代计算机,2007(4):20-22.
2王媛媛,周涛,吴翠颖.深度学习及其在医学图像分析中的应用研究[J].电视技术,2016,40(10):118-126. 被引量：15
3郭欣,贾海蓉,王栋.利用子空间改进的K-SVD语音增强算法[J].西安电子科技大学学报,2016,43(6):109-115. 被引量：4
4杨立春.一种基于语音活动检测的声源定位方法[J].电脑知识与技术,2017,13(2):251-252.
5黄玉蕾,罗晓霞,刘笃仁.MFSC系数特征局部有限权重共享CNN语音识别[J].控制工程,2017,24(7):1507-1513. 被引量：9
6何元利,龚晓峰.基于卷积神经网络的无线电信号搜索[J].兵工自动化,2017,36(10):88-92. 被引量：1
7李浩,鲍鸿,张晶.基于深度神经网络的说话人识别模型研究[J].电脑与信息技术,2018,26(5):1-3. 被引量：3
8任立国,张熇,朱桂.基于兴趣推荐算法的短视频传播模式研究[J].江西电力,2022,46(4):34-35. 被引量：2

同被引文献23

1梁爽,王丽燕,王艳霄,梁巍.声场校准周期及影响因素分析[J].听力学及言语疾病杂志,2016,24(1):81-84. 被引量：1
2王晓静.基于认知策略理论的大学英语听力教学模式研究[J].外语教学,2016,37(2):65-68. 被引量：60
3林静,杨继臣,张雪源,李新超.基于稀疏表示权重张量的音频特征提取算法[J].计算机应用,2016,36(5):1426-1429. 被引量：5
4康雷鸣.多模态符号学视角的大学生运动员英语教学设计[J].武汉体育学院学报,2016,50(10):90-95. 被引量：5
5张秋余,省鹏飞,黄羿博,董瑞洪,杨仲平.多格式音频感知哈希算法[J].北京邮电大学学报,2016,39(4):77-82. 被引量：4
6刘鑫,鲍长春.基于回声状态网络的音频频带扩展方法[J].电子学报,2016,44(11):2758-2766. 被引量：3
7张宏乐,李凤莲,张雪英.一种基于新型BDS模型的语音信号字典构造方法[J].微电子学与计算机,2017,34(1):30-34. 被引量：1
8黄伟.多模态环境下大学英语听力教学实证研究[J].外国语文,2016,32(6):150-156. 被引量：20
9杨臻.语音信号准确性识别仿真研究[J].计算机仿真,2017,34(2):285-288. 被引量：6
10徐文超,王光艳,陈雷.改进的变步长最小均方误差电子耳蜗语音增强算法[J].计算机应用,2017,37(4):1212-1216. 被引量：6

引证文献2

1王青云.多媒体英语听力自动评价系统设计[J].计算机应用与软件,2022,39(10):141-146.
2董胡,陈伟,彭高丰,陈耀东,刘刚.基于信号子空间和DNN的语音增强方法[J].微型电脑应用,2025,41(1):32-34. 被引量：1

二级引证文献1

1黎华,杨浩.语音增强技术在机械领域的应用[J].造纸装备及材料,2025,54(10):64-67.

1陈国明,赵力,邹采荣.窄带噪声下的子空间语音增强算法[J].应用科学学报,2007,25(3):243-246. 被引量：5
2任永梅.一种改进的子空间语音增强算法[J].科技视界,2015(26):55-56.
3孙成立,穆俊生.基于特征值置换的子空间语音增强算法[J].计算机工程,2016,42(2):272-277. 被引量：1
4叶琪,陶亮,周健,王华彬.基于联合失真控制的子空间语音增强算法[J].声学技术,2016,35(3):254-259.
5乔宽,杨中豪.基于深度神经网络的语音增强研究[J].广东通信技术,2015,35(6):62-64. 被引量：3
6邢安昊,张鹏远,潘接林,颜永红.基于SVD的DNN裁剪方法和重训练[J].清华大学学报(自然科学版),2016,56(7):772-776.
7王坚,张媛媛.基于深度神经网络的汉语语音合成的研究[J].计算机科学,2015,42(S1):75-78. 被引量：10
8薛少飞,宋彦,戴礼荣.基于多GPU的深层神经网络快速训练方法[J].清华大学学报（自然科学版）,2013,53(6):745-748. 被引量：4
9刘扬,王思明.基于小波变换的信号去噪的应用研究[J].电脑与信息技术,2005,13(2):29-32. 被引量：3
10向北海,于肇贤,曲寒冰.一种基于MFRAT和ICP的掌纹主线提取和配准算法[J].模式识别与人工智能,2015,28(3):260-265. 被引量：3

太原理工大学学报

2016年第5期

浏览历史

内容加载中请稍等...

基于DNN的子空间语音增强算法被引量：2

参考文献8

二级参考文献40

共引文献8

同被引文献23

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于DNN的子空间语音增强算法 被引量：2

参考文献8

二级参考文献40

共引文献8

同被引文献23

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于DNN的子空间语音增强算法被引量：2