基于小波包分解的含噪语音时频特性分析及端点检测被引量：3

Endpoint Detection of Noise-Corrupted Speech Time-Frequency Characteristics Based on Wavelet Packet Decomposition

下载PDF

导出

摘要针对Hilbert-Huang变换方法在语音处理过程中存在模态混叠问题,本文提出了基于小波包分解的语音时频分析方法。首先对含噪语音进行小波包分解,对各分量分别进行经验模态分解,并运用相关系数阈值准则对固有模态函数进行筛选;然后建立语音信号的Hilbert谱和瞬时能量谱;最后将基于小波包分解的HilbertHuang变换瞬时能量谱方法应用于含噪语音的端点检测。实验结果表明:与传统广义维数以及谱熵算法相比,本文方法具有更好的准确性、稳定性和自适应性,能够有效描述语音信号非线性非平稳的时频特性。 To overcome the problem of mode mixing for Hilbert-Huang transform （HHT） in speech processing, a new method of time-frequency analysis based on wavelet packet decompo- sition （WPD） is proposed in this paper. Firstly, noise-corrupted speech is decomposed by u- sing WPD, each component is carried out empirical mode decomposition （EMD） separately, and the intrinsic mode function （IMF） is selected by using correlation threshold criterion. Then, the Hilbert spectrum and instantaneous energy spectrum of speech signal are achieved. Finally, the method of instantaneous energy spectrum based on WPD is applied to noise-cor- rupted speech endpoint detection. Experimental results indicate that the proposed method is more accurate, robust and self-adaptive by comparison with the original generalized dimension （OGD） and the spectral entropy（SE） algorithms. The proposed method can effectively de- scribe the time-frequency characteristics of the non-linear and non-stationary speech signal, and has provided a new idea for the research of speech signal.

作者陈金龙范影乐倪红霞武薇

机构地区杭州电子科技大学智能控制与机器人研究所

出处《数据采集与处理》 CSCD 北大核心 2014年第2期293-297,共5页 Journal of Data Acquisition and Processing

基金国家自然科学基金(60302027)资助项目浙江省教育厅科研计划(Y201018050)资助项目

关键词语音端点检测 Hilbert—Huang变换时频分析相关系数阈值准则小波包分解 speech endpoint detection Hilbert-Huang transform time-frequency analysis correlation coefficient threshold criterion wavelet packet decomposition

分类号 TN911.7 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1Kim K, Kim M Y. Robust speaker recognition a- gainst background noise in an enhanced multi-condi- tion domain[J]. IEEE Transactions on Consumer Electronics, 2010, 56(3): 1684-1688.
2余华,黄程韦,金赟,赵力.基于粒子群优化神经网络的语音情感识别[J].数据采集与处理,2011,26(1):57-62. 被引量：20
3Backstrom T, Magi C. Effect of white-noise correc- tion on linear predictive coding[J]. IEEE Signal Pro- cessing Letters, 2007, 14(2): 148-151.
4Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proc. R. Soc. Lond. A, 1998,454: 903-995.
5Huang H, Pan J Q. Speech pitch determination based on Hilbert-Huang transform[J]. Signal Pro cessing, 2006, 86(4): 792-803.
6Molla K I, Shaikh M, Hirose K. Time-frequency representation of audio signals using Hilbert spec trum with effective frequency scaling[C] // Proceed- ing of llth International Conference on Computer and Information Technology ( ICCIT ). Khulna: IEEE, 2008: 335-340.
7Peng Z K, Tse P W, Chu F L. An improved Hilbert- Huang transform and its application in vibration sig- nal analysis [J]. Journal of Sound and Vibration, 2005, 186(2): 187- 205.
8Yuan L, Yang B H, Ma S W, et al. Combination of wavelet packet transform and Hilbert-Huang trans form for recognition of continuous EEG in BCIs [C] // Proceeding of the 2nd IEEE International Con- ference Computer Science and Information Technolo- gy. Beijing, China: IEEE, 2009: 594-599.
9Varga A. Assessment for automatic speech recogni- tion: Ⅱ. NOISEX-92: A database and an experi ment to study the effect of additive noise on speech recognition systems [J]. Speech Communication, 1993, 12(3): 247-251.
10武薇,范影乐,庞全.基于广义维数距离的语音端点检测方法[J].电子与信息学报,2007,29(2):465-468. 被引量：11

二级参考文献36

1Heard R W.Affective computing[M].Cambridge:MIT Press,1997.
2Heard R W.Toward computers that recognize and respond to user emotion[J].IBM Technical Journal,2000,38(2):705-719.
3Qiang Guo,Zhang Peter.Neural networks for classification:a survey[J].IEEE Transaction on Systern,Man,and Cybernetics Application and Reviews,2000,30(4):451-462.
4Yamada T,Hashimoto H,Tosa N,Pattern recognition of emotion with neural network[C] //Proceeding of the 1995 IEEE IECON 21st International Conference on Industrial Electronics.Control,and Instrumentation.[S.l.] :IEEE,1995,1:183-187.
5Sato H,Mitsukura Y,Fukumi M,et al.Emotional speech classification with prosodic parameters by using neural networks[C] //Seventh Australian and NewZealand Intelligent Information Systems Conference.New Zealand:[s.n.] ,2001:395-398.
6Nicholson J,Takahashi K,Nakatsu R.Emotion recognition in speech using neural networks[C] //Proceedings ICONIP 99,6 th International Conference on Neural Information Processing,1999(2):16-20.
7日本文部省.情感信息处理的信息学、心理学研究.[R].1999.
8Shi Y,Eberhart R C.A modified swarm optimizer[C] //IEEE International Conference on Evolutionary Computation.Anchorage,AK,USA:IEEE,1998:69-73.
9Eberhart R C,Shi Y.Comparing inertia weights and constriction factors in particle swarm optimization[C] //2000 Congress on Evolutionary Computation.La Jolla CA USA:[s.n.] ,2000:84-88.
10Chasaide A N,Gobl C.Voice quality and the synthesis of affect[J].Improvements in Speech Synthesis,2002:252-263.

共引文献29

1周红标.融合语音和脉搏的多模态情感识别研究[J].微电子学与计算机,2015,32(6):5-9. 被引量：6
2阙大顺,李星星,胡慧玲.基于分形维的连续语音实时分割技术[J].电讯技术,2008,48(11):33-37. 被引量：2
3卜庆凯,胡爱群.一种面向用户的体育视频精彩内容提取方法[J].模式识别与人工智能,2008,21(6):782-786. 被引量：2
4卜庆凯,胡爱群,刘威.基于音/视频特征的足球视频体育事件交互式检索方法[J].信号处理,2009,25(7):1070-1075.
5李晋,刘甫,王玲,许慧燕.改进的语音端点检测技术[J].计算机工程与应用,2009,45(24):133-135. 被引量：9
6姜占才,孙燕,王得芳.基于复合能量和自适应阈值的语音端点检测[J].计算机工程与科学,2010,32(4):136-138. 被引量：1
7王强,曾向阳,王曙光.室内声环境中的语音端点检测自适应算法[J].电声技术,2012,36(10):49-52.
8王福友,罗钉,季亚新,胡新梅.海杂波多分形特性分析及小目标检测技术研究[J].信号处理,2013,29(2):239-248. 被引量：8
9王凯.粒子群优化RBF神经网络的语音识别研究[J].数字技术与应用,2013,31(4):109-110.
10李忠国,侯杰,王凯,刘庆华.模糊支持向量机在路面识别中的应用[J].数据采集与处理,2014,29(1):146-151. 被引量：13

同被引文献37

1卢宇,贺国光.基于改进型替代数据法的实测交通流的混沌判别[J].系统工程,2005,23(6):21-24. 被引量：9
2周福昌,陈进,何俊,毕果,张桂才,李富才.循环平稳信号处理在机械设备故障诊断中的应用综述[J].振动与冲击,2006,25(5):148-152. 被引量：24
3GUO Yanmeng FU Qiang YAN Yonghong.Speech endpoint detection in real noise environments[J].Chinese Journal of Acoustics,2007,26(1):39-48. 被引量：5
4武薇,范影乐,庞全.基于广义维数距离的语音端点检测方法[J].电子与信息学报,2007,29(2):465-468. 被引量：11
5王兴元,谭贵霖.Liley模型的模拟EEG信号的非线性预测和分析[J].计算物理,2007,24(5):612-618. 被引量：3
6刘华平,李昕,郑宇,徐柏龄,姜宁.一种改进的自适应子带谱熵语音端点检测方法[J].系统仿真学报,2008,20(5):1366-1371. 被引量：26
7王晓兰,张万宏,王慧中.基于小波变换和AR-LSSVM的非平稳时间序列预测[J].控制与决策,2008,23(3):357-360. 被引量：28
8刘华平,李昕,徐柏龄,姜宁.语音信号端点检测方法综述及展望[J].计算机应用研究,2008,25(8):2278-2283. 被引量：42
9谢平,陈广才,雷红富.基于Hurst系数的水文变异分析方法[J].应用基础与工程科学学报,2009,17(1):32-39. 被引量：87
10De-Xiang Zhang,Xiao-Pei Wu,Zhao Lv.Speech Endpoint Detection in Noisy Environments Using EMD and Teager Energy Operator[J].Journal of Electronic Science and Technology,2010,8(2):183-186. 被引量：4

引证文献3

1章小兵,李燕萍,王双杰.基于改进HHT的语音端点检测[J].计算机工程,2016,42(6):171-174. 被引量：4
2陈喆,王荣,周文颖,殷殷,殷福亮.非平稳信号度量方法综述[J].数据采集与处理,2017,32(4):667-683. 被引量：11
3李海涛,雷迎科,李鹏程.面向格式化报文结构的数据链战术行为认知可行性初探[J].空军工程大学学报,2023,24(4):102-110. 被引量：1

二级引证文献16

1吴兴铨,周金治.基于改进小波变换的语音基音周期检测[J].自动化仪表,2017,38(6):67-70. 被引量：7
2陈铭钧,陶凌,李富贵,刘九畅.HHT在白细胞亚群分类算法中的应用[J].南昌大学学报（理科版）,2018,42(1):72-75.
3叶华,谭冠政,李广,刘晓琼,李晋,周聪,朱会杰.基于稀疏表示与粒子群优化算法的非平稳信号去噪研究[J].红外与激光工程,2018,47(7):318-325. 被引量：14
4范珍艳,庄晓东.生物医学信号的非线性动力学分析进展综述[J].电子元器件与信息技术,2017,1(5):7-15.
5王海宁,谢峰,李楠,韩凤华.基于功率谱特征分析的立铣刀磨损实时监测方法[J].工具技术,2019,53(3):123-126. 被引量：6
6王艳超.低压电气设备运行状态信号特征检测系统设计[J].电子设计工程,2019,27(7):113-117. 被引量：4
7刘丽.低信噪比下语音多路信号端点切分仿真[J].计算机仿真,2019,36(7):161-164. 被引量：1
8张仲良,朱晓军,彭飞,牟金磊.基于HHT的船体结构应力监测数据特征分析和去噪方法[J].中国舰船研究,2019,14(S01):158-164. 被引量：6
9王光艳,杨秀芬,祝琼珂,罗雨章,江淇.基于HHT自相关技术的水下语音增强方法研究[J].新一代信息技术,2019,2(10):10-17.
10蔡长征.数据驱动算法在旋转机械故障诊断中的应用研究[J].机床与液压,2020,48(23):218-223. 被引量：9

1吕建慧,席泽敏,卢建斌,刘江波.基于Hilbert-Huang变换的雷达信号特征提取技术[J].雷达科学与技术,2009,7(5):339-344. 被引量：3
2刘淑聪,高尔根,陈逊,刘春侠.小波包多阈值法在地震信号去噪中的应用研究[J].现代电子技术,2015,38(23):54-59. 被引量：3
3赵仁才,颜龙,张登科,郭军.基于频谱分析的卫星2DPSK信号解调[J].无线电工程,2004,34(7):7-9.
4张凤仪,夏秀渝,冉国敬,何礼,叶于林.多声源环境下的鲁棒说话人识别[J].计算机系统应用,2015,24(4):32-37. 被引量：1
5欧阳喜,葛临东.一种利用短时DFT分析实现全数字2DPSK接收机解调的新算法[J].电讯技术,2001,41(1):59-62. 被引量：8
6叶琪,陶亮,周健,王华彬.基于噪声谱约束的二值掩码估计语音增强算法[J].信号处理,2016,32(1):70-76. 被引量：1
7郝研,王太勇,万剑,张攀,刘路.基于经验模式分解和广义维数的机械故障诊断[J].吉林大学学报（工学版）,2012,42(2):392-396. 被引量：6
8侯炜,张林,山秀明.宽带认知OFDM系统的混合频谱感知技术[J].清华大学学报（自然科学版）,2010,50(10):1690-1694. 被引量：2
9郝研,王太勇,万剑,张攀.基于级联双稳随机共振和多重分形的机械故障诊断方法研究[J].振动与冲击,2012,31(8):181-185. 被引量：17
10陈红,蔡晓霞,徐云,刘文涛.基于多重分形特征的通信调制方式识别研究[J].电子与信息学报,2016,38(4):863-869. 被引量：18

数据采集与处理

2014年第2期

浏览历史

内容加载中请稍等...

基于小波包分解的含噪语音时频特性分析及端点检测被引量：3

参考文献10

二级参考文献36

共引文献29

同被引文献37

引证文献3

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于小波包分解的含噪语音时频特性分析及端点检测 被引量：3

参考文献10

二级参考文献36

共引文献29

同被引文献37

引证文献3

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于小波包分解的含噪语音时频特性分析及端点检测被引量：3