基于HHT倒谱系数的说话人识别算法被引量：4

Speaker recognition algorithm based on HHT cepstrum coefficient

下载PDF

导出

摘要针对LPCC只反应语音静态特征且不能突出其低频局部特征问题,提出一种以HHT倒谱系数为特征的说话人识别算法,HHT的经验模态分解使语音的低频局部特征得到更好的描述,Hilbert变换能够刻画语音动态特性,改进了LPCC的不足。用经验模态分解将语音分解为一系列固有模态函数分量并做Hilbert变换求得Hilbert边际谱,计算总边际谱的对数功率谱并做DCT得13维倒谱系数,将此特征送入高斯混合模型进行说话人识别。仿真实验结果表明,基于HHT倒谱系数的说话人识别算法,相较LPCC识别率提高了12.59%,但特征提取时间增加了19.27 s。 According to the problem that LPCC only reacts speech signal static characteristics and can not describe the low frequency local characteristics of speech signal well, a new speaker recognition algorithm based on HHT cepstrum coefficient is proposed. The low frequency local characteristics of the signal can be described better by the empirical mode decomposition of HHT. The dynamic characteristics are reacted by the Hilbert transform, improving the LPCC deficiencies. Speech signal is decomposed into intrinsic mode components using empirical mode decomposition. Hilbert transform is done for each component to get the Hilbert marginal spectrum. The logarithmic power spectrum of total marginal spectrum is calculated and then done the DCT to get 13-dimensional cepstrum coefficient. The feature is sent into the gaussian mixture model to do speaker recognition. Simulation results demonstrate that compared to the LPCC, the HHT cepstrum coefficient gets a higher recognition rate. Recognition rate is increased by 12.59%, but feature extraction time is increased by 19.27 s.

作者杜晓青于凤芹

机构地区江南大学物联网工程学院

出处《计算机工程与应用》 CSCD 2014年第3期198-202,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61075008)

关键词说话人识别希尔伯特黄变换(HHT) 倒谱系数 speaker recognition Hilbert-Huang Transform（HHT） cepstrum coefficient

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1Huang Norden E.,Shen Zheng,Long Steven R.,Wu Manli C.,Shih Hsing H.,Zheng Quanan,Yen Nai-Chyuan,Tung Chi Chao,Liu Henry H.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society A: Mathematical Physical and Engineering Sciences.1998(1971)
2M. Chetouani,M. Faundez-Zanuy,B. Gas,J.L. Zarader.Investigation on LP-residual representations for speaker identification[J].Pattern Recognition.2008(3)

同被引文献69

1刘红星,戴蓓蒨,陆伟.基于共振峰谐波能量的语音端点检测[J].清华大学学报（自然科学版）,2008,48(S1):754-759. 被引量：11
2罗宇,杜利民.基于概率加权平均的Mel子带特征重建算法[J].电子学报,2004,32(10):1738-1741. 被引量：1
3刘敬伟,徐美芝,郑忠国,程乾生.基于DTW的语音识别和说话人识别的特征选择[J].模式识别与人工智能,2005,18(1):50-54. 被引量：13
4于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
5杜伯学,魏国忠.基于小波与分形理论的电力设备局部放电类型识别[J].电网技术,2006,30(13):76-80. 被引量：38
6李凌,曾以成,雷雄国.EMD在说话人辨认中的应用[J].湘潭大学自然科学学报,2006,28(3):108-111. 被引量：6
7QIAN S, MORRIS J M. Wigner distribution decomposition and cross-terms delete representation[J]. Signal Processing, 1992,27 : 125 - 144.
8WONG K M, JIN Q. Estimation of the time-varying frequency of a signal: The cramer-ral bound and the ap- plication of Wigner distribution[J]. IEEE Trans Signal Processing, 1990,1 770:358-375.
9HUANG N E, SHEN Z, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-station time series analysisI-J3. The Royal Society, 1998, A454 : 903- 995.
10HUANG N E,WU M L, QU W, et al. Applications of Hilbert-Huang transform to nonstationary financial time series analysis[J]. Applied Stochastic Models in Business and Industry,2003,19:245-268.

引证文献4

1曾以成,陈雨莺,毛燕湖,谢小娟.基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取[J].湘潭大学自然科学学报,2015,37(2):20-26. 被引量：2
2甄倩倩,张庭亮.说话人识别综述[J].科技资讯,2017,15(25):241-243. 被引量：1
3贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：7
4邵琪,陈文祥,姜佳辉,陆志文.基于VMD-Hilbert倒谱和多重分形特征的电力电缆局放识别[J].南京工程学院学报（自然科学版）,2020,18(1):32-37. 被引量：3

二级引证文献13

1魏艳鸣,海本斋.基于EMD和改进多重信号分类的感应电机故障检测方法[J].微特电机,2017,45(7):37-40. 被引量：4
2张明键,张悦.基于语谱图HOG特征的两步法长沙话说话人识别[J].信息技术与信息化,2020(8):188-192. 被引量：1
3张明键,张悦.基于语谱图和深度置信网络的方言自动辨识与说话人识别[J].电子技术与软件工程,2020(14):151-154. 被引量：2
4乐妍.基于人工神经网络无监督聚类方法的青少年体质综合评价模型研究[J].江苏科技信息,2020,37(33):76-79.
5刘传永,王明,赵普志,刘俊,吴伟丽,侯李祥.基于电抗器开断过电压特征分析的匝间绝缘短路故障在线辨识[J].电网与清洁能源,2022,38(8):7-15. 被引量：17
6汪兰兰,蔡昌新.基于改进线性预测基音频率的语音情感识别系统[J].科学技术与工程,2022,22(26):11524-11532. 被引量：8
7何龙,谭栋,李勇,刘海波,吴伟丽,陈宝旭.用于铁磁谐振过电压故障辨识的VMD参数优化方法研究[J].数学的实践与认识,2022,52(9):102-114. 被引量：5
8姜珊,张二华,张晗.基于Bi-GRU+BFE模型的短语音说话人识别[J].计算机与数字工程,2022,50(10):2233-2239. 被引量：3
9马志举,杜庆治,龙华,邵玉斌.基于改进语谱图的深度学习说话人识别[J].现代电子技术,2023,46(21):32-38. 被引量：7
10Fuzhao Chen,Zhilei Chen,Qian Chen,Tianyang Gao,Mingyan Dai,Xiang Zhang,Lin Sun.Research on motor rotation anomaly detection based on improved VMD algorithm[J].Railway Sciences,2024,3(1):18-31. 被引量：1

1王贵平,鲍长春,李靓.语音特征波形的分解与量化[J].电声技术,2005,29(1):50-54. 被引量：1
2张建,黄勇,关键,何友.基于局部Hilbert边际谱隶属度的微弱目标检测算法[J].信号处理,2011,27(9):1335-1340. 被引量：4
3方超.基于EEMD和Hilbert边际谱的天然气压缩机故障诊断[J].潍坊学院学报,2015,15(2):39-42.
4李宁,苏超伟.关于散射变换的特征问题[J].微波学报,1995,11(4):266-273. 被引量：1
5石环英,石琳.利用霍尔元件测永磁材料的静态特征[J].物理实验,1994,14(6):246-248.
6一帆.VoIP——互联网时代通信的新宠儿[J].百科知识,2007(06X):17-17.
7宋灿,焦健,王久辉.雷达辐射源信号特征问题研究[J].电子工程,2009(4):1-4.
8胡永刚,张雄伟,邹霞,张立伟,郑云飞.贝叶斯非负矩阵分解语音增强的优化算法[J].解放军理工大学学报（自然科学版）,2015,16(1):1-6. 被引量：2
9李彦兵,张曦文,李飞,陈大庆,高红卫.一种大加速度机动目标微动参数估计方法[J].电子与信息学报,2017,39(1):82-87. 被引量：11
10陈丹丹,王小敏,王平,郭进,赵才友.基于顺序统计滤波的高速道岔振动信号端点检测[J].铁道学报,2013,35(11):60-65. 被引量：2

计算机工程与应用

2014年第3期

浏览历史

内容加载中请稍等...

基于HHT倒谱系数的说话人识别算法被引量：4

参考文献2

同被引文献69

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于HHT倒谱系数的说话人识别算法 被引量：4

参考文献2

同被引文献69

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于HHT倒谱系数的说话人识别算法被引量：4