改进加权线性预测倒谱的复合参数说话人识别

SPEAKER RECOGNITION USING COMPOSITE PARAMETERS WITH WEIGHTING FUNCTION IMPROVED LINEAR PREDICTION CEPSTRUM

下载PDF

导出

摘要说话人识别和确认是信号处理中研究的热点之一,但有关文献表明识别效率并不是很高,而且训练和识别的语音要求都比较长,距离实际应用还有一定差距。分析了说话人识别中有关参数的选取对识别结果的影响,采用线性预测倒谱和基音参数共同作为识别参数,并采用矢量量化,改进了线性预测倒谱距离的加权函数,提供了与文本无关的说话人识别系统。最后给出了实验结果和有关分析,在低噪声时识别正确率可达99%以上,在高噪声时也能达到98%以上的正确率。 Speaker recognition and identification is one of the research hot topics in signal processing.But the related documents indicate that its recognising efficiency has limitations,and long speech is required for training and recognition,there is still certain distance apart from the practical application.In this article we analyse the influence of selecting relevant parameters in speaker recognition on the outcome of recognition,and provide a speaker recognition system independent to the text which uses linear prediction（LP） cepstrum and pitch parameter as the joint recognition parameters,and quantises vectors by the vector quantization（VQ）,improves the weighting function of LP cepstrum distance.The experimental results and relevant analysis are given in the last part of the paper.In low noise environment the recognition correct rate approaches 99% or higher,and that is also higher than 98% in condition of high-noise.

作者杨顺辽林峰刘焕升陈玉炎

机构地区长江大学电信学院

出处《计算机应用与软件》 CSCD 2011年第2期242-245,共4页 Computer Applications and Software

基金大学生创新实验计划项目(091048936)

关键词说话人识别线性预测倒谱基音矢量量化 Speaker recognition LP cepstrum Pitch Vector quantization

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1Phu Chien Nguyen,Masato Akagi,Tu Bao Ho.A Promising Approach to VQ_Based Spesker Recognition[C]//2003 IEEE International Conference on Acoustics,Speech,and Signal Processing,Procedings Volume Ⅰ of Ⅵ Speech Processing Ⅰ.2003:184-187.
2M.A.EL-Gamal,M.F.ABU El-Yazeed,EL M M H.Ayadi.Enhancing the Performance of Ganssian Mixture Model-Based Text Independent Speaker Recognition[J].International Journal of Speech Technology,2005,8:93-103.
3Limin Xu,Zhenmin Tang.Speaker Identification Using Multi-Step Clustering Algorithm with Transformation-Based GMM[J].Automatic Control and Computer Science,2007,41:224-231.
4Marcos Faundez-Zamuy.A Combination Between VQ Covariance Matrices for Speaker Recognition[C]//The 2001 IEEE International Conference on Acoustics,Speech,and Signal Processing(ICASSP2001),vol.I:Speech Processing 1,Utah,USA,2001:453-456.
5Andrens Stolcke,Sachin S Kajarekar,Luciana Ferrer.Speaker Recognition with Session Variability Normalization Based on MLLR Adaptation Transforms[J].IEEE Transaction on Audio,Speech and Language Processing,2007,15(7):1987-1998.
6Robert M Nickel.Saehin P Oswal,Ananth N Iyer.Robust Speaker Verification with Principal Pitch Components[J].International Journal of Speech Technology,2005,8(4):323-339.
7亢明,汪成亮,陈娟娟.基于动态阈值失量量化的说话人识别[J].计算机应用,2009,29(1):146-148. 被引量：4
8陈明义,周昆湘,余伶俐.一种基于VQ的说话人确认的阈值设计方法[J].计算机工程与应用,2007,43(13):117-119. 被引量：1
9俞一彪,袁冬梅,薛峰.一种适于说话人识别的非线性频率尺度变换[J].声学学报,2008,33(5):450-455. 被引量：14

二级参考文献18

1芮贤义,俞一彪.基于小波变换的鲁棒型特征提取及说话人识别[J].电路与系统学报,2005,10(5):129-132. 被引量：7
2俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7
3包永强,赵力,邹采荣.采用归一化补偿变换的与文本无关的说话人识别[J].声学学报,2006,31(1):55-60. 被引量：13
4张玲华,郑宝玉,杨震.基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用[J].电子与信息学报,2006,28(10):1786-1789. 被引量：3
5芮贤义,俞一彪.噪声环境下说话人识别的组合特征提取方法[J].信号处理,2006,22(5):673-677. 被引量：12
6[美]Z.米凯利维茨.演化程序:遗传算法和数据编码的结合[M].周家驹,何险峰,译.北京:科学出版社,2000.
7HAN WEI, CHAN CHEONG-FAT, CHOY CHIU-SING, et al. An efficient MFCC extraction method in speech recognition [ C]// ISCAS 2006: Proceedings of 2006 IEEE International Symposium. Hong Kong: IEEE Press 2006:145 - 148.
8VASUKI A, VANATHI P T. A review of vector quantization techniques[J]. Potentials, IEEE, 2006,25(4):39-47.
9PAN ZHI-BIN, KOTANI K. Constructing better partial sums based on energy-maximum criterion for fast encoding of VQ[ C]//APCCAS 2006: IEEE Asia Pacific Conference Circuits and Systems. Singapore: IEEE Press, 2006:1563 - 1566.
10LI JIU-HUA, LING NAM. A novel VQ codebook design technique [ C]//IEEE Transactions Consumer Electronics. Rosemont, IL: IEEE Press, 1997, 43(4) : 1206 - 1212.

共引文献16

1薛峰,俞一彪.倒谱域特征分量置信度分析及说话人识别应用[J].信号处理,2010,26(1):127-131. 被引量：4
2李燕萍,唐振民,丁辉,张燕.一种适于说话人辨认的自适应频率尺度变换[J].南京理工大学学报,2010,34(2):182-186. 被引量：2
3卢小春,尹俊勋,王修信.基于听觉模型特征的与文本无关说话人识别系统[J].广西师范大学学报（自然科学版）,2010,28(2):22-26. 被引量：2
4郭春霞.说话人识别算法的研究[J].西安邮电学院学报,2010,15(5):104-106. 被引量：5
5孙彦群,俞一彪.基于有效特征集选择的说话人识别[J].电脑知识与技术,2011,7(4):2360-2362.
6姜涛,韩纪庆,郑铁然.基于高斯混合模型移动因子补偿的说话人识别方法[J].声学学报,2011,36(6):658-664. 被引量：3
7杨顺辽.基于说话人确认系统的语音处理综合实验[J].高校实验室工作研究,2012(3):15-17.
8项要杰,杨俊安,李晋徽,陆俊.一种适用于说话人识别的改进Mel滤波器[J].计算机工程,2013,39(11):214-217. 被引量：8
9王韵琪,俞一彪.自适应高斯混合模型及说话人识别应用[J].通信技术,2014,47(7):738-743. 被引量：8
10武朋辉,杨百龙,时磊.基于离散余弦变换的语音压缩采样和编码算法[J].应用声学,2015,34(1):17-23. 被引量：2

1李波.基于DSP的声纹识别技术的研究[J].辽宁工业大学学报（自然科学版）,2010,30(4):218-221.
2杨建华,于小宁.说话人识别中语音特征参数研究[J].大理学院学报（综合版）,2009,8(8):32-35. 被引量：5
3刘丽媛,严家明.一种孤立词语音识别的实现方法及改进[J].现代电子技术,2010,33(16):109-112. 被引量：3
4王博,郭英,段艳丽,陈琪.基于倒谱特征的语音端点检测算法研究[J].信号处理,2005,21(Z1):212-215.
5刘万洪.跳频通信语音信号干扰效果评估方法研究[J].无线电通信技术,2000,26(5):18-19. 被引量：1
6王博,郭英,李宏伟,韩立峰.基于倒谱距离的语音端点检测改进算法[J].空军工程大学学报（自然科学版）,2006,7(1):59-63. 被引量：10
7刘晋胜,周靖.基于TMS320VC5402的电子语音锁的系统设计[J].电声技术,2006,30(7):28-31. 被引量：2
8王光艳,赵晓群,王霞.语音信号时频特征显示系统的设计和仿真[J].计算机工程与应用,2010,46(29):73-75. 被引量：4
9龚伟,汪鲁才.基于隐马尔可夫模型的话者识别研究[J].声学与电子工程,2006(2):31-33. 被引量：2
10董胡.一种改进的基于倒谱距离端点检测方法研究[J].计算机与数字工程,2013,41(7):1078-1080. 被引量：4

计算机应用与软件

2011年第2期

浏览历史

内容加载中请稍等...

改进加权线性预测倒谱的复合参数说话人识别

参考文献9

二级参考文献18

共引文献16

相关作者

相关机构

相关主题

浏览历史