结合主分量分析及Fisher准则的说话人识别方法研究被引量：3

Research of Speaker Recognition Based on PCA

下载PDF

导出

摘要本文提出了一种基于主分量分析和Fisher准则的新的Mel频率域特征参数。它是在Mel域频谱的基础上做主分量分析,并且根据Fisher准则,按Fisher比的大小进行特征参量的选择而得到的。它充分的利用了各频带间的相关统计信息,能更紧致有效的区分说话人。这样得到的特征矢量,与传统的按相应特征值进行特征选择的方法相比,在相同维数时具有最大的类别区分度。最后我们实现了一个文本无关的说话人自动识别系统,它的后端采用矢量量化实现聚类分析。在语音库上的实验表明本文的特征矢量在说话人识别上比相同维数的传统特征矢量识别率更高,证实了它紧致、区分度好、冗余信息少的优良性能。 A new feature vectorMel Frequency Principal Coefficient (MFPC), used for speaker recognition is proposed. It is derived from Principal Component Analysis on the Mel Scale Spectrum Vector. The correlation information among different frequency channels, which is mainly caused by the vocal tract resonance, can be efficiently exploited by means of MFPC. This correlation information has been found to vary consistently from one speaker to another. Feature coefficients are chosen according to their Fisher Ratio. Compared with conventional Frequency Cepstrum Coefficient, the proposed feature vector can give greater distance between classes under the condition of same dimensions. A text-independent speaker recognition system has been complemented based on Vector Quantization to design the code-books of a given reference speaker. Experiment results demonstrate that the proposed feature vector has many good performances as compact, easy to be discriminated and low redundancy.

作者丁佩律张立明

机构地区复旦大学电子工程系智能与图像实验室

出处《电路与系统学报》 CSCD 2002年第1期116-119,共4页 Journal of Circuits and Systems

基金国家自然科学基金资助项目(39870194)

关键词主分量分析Fisher准则说话人识别语音识别 Mel Frequency Principal Coefficient (MFPC) Principle Component Analysis (PCA) Vector Quantization (VQ) Fisher Ratio.

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1边肇祺.模式识别[M].清华大学出版社,1999..

共引文献60

1王新峰,邱静,刘冠军.机电BIT故障特征选择方法研究[J].中国机械工程,2004,15(12):1048-1050. 被引量：1
2郭陟,赵曦滨,顾明.基于CCA的入侵检测行为轮廓创建技术研究[J].电子学报,2004,32(8):1381-1384.
3张晓庆,孙永庆,张峥.基于不确定性纹理谱的金属断口形貌识别[J].金属学报,2004,40(10):1018-1022. 被引量：4
4杨斌,赵红漫,赵宗涛,张乐.一个改进的遥感图像目标纹理分类识别算法[J].微电子学与计算机,2004,21(9):111-113. 被引量：5
5王肃宁,杨士元,汪鹏.基于模式识别进行模拟电路故障诊断的方法[J].微电子学与计算机,2004,21(11):113-116. 被引量：6
6杨余旺,杨静宇.多距离分类器组合试验在人脸识别中的应用[J].计算机工程,2005,31(2):50-53. 被引量：2
7李财莲,贾永兴,岳振军.基于自适应遗传算法和BP网络的物重监测模型[J].系统工程与电子技术,2005,27(2):377-380. 被引量：1
8黄晓斌,万建伟,王展.一种计算样本协方差矩阵迹的快速递推算法[J].模式识别与人工智能,2004,17(4):497-501. 被引量：1
9汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
10张国宣,孔锐,施泽生,郭立,刘士建,薛明东.基于核聚类方法的多层次支持向量机分类树[J].计算机工程,2005,31(5):172-174. 被引量：3

同被引文献21

1陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
2杨阳,陈永明.声纹识别技术及其应用[J].电声技术,2007,31(2):45-46. 被引量：23
3CAMPBELL W M,STURIM D E,REYNOLDS D A.Support vector machines using GMM supervectors for speaker verification[J].IEEE Transaction on Signal Processing Letters,2006,13(5):308-311.
4JAAKKOLA T S,HAUSSLER D.Exploiting generative models in discriminative classifiers[C]//KEARNS M S,SOLLA S A,COHN D A.Advances in Neural Information Processing Systems 11.Cambridge:MIT Press,1998.
5WAN V,RENDS S.Speaker verification using sequence discriminant support vector machines[J].IEEE Transaction on Speech and Audio Processing,2005,13(2):203-210.
6XU Limin,TANG Zhenmin.Speaker identification using multi-step clustering algorithm with transformation-based GMM[J].Automatic Control and Computer Sciences,2007,41(4):224-231.
7SONG F X,LIU S H,YANG J Y.Orthogonalized Fisher discriminant[J].Pattern Recognition,2003,38:311-313.
8CHEN L,MAN H,NEFIAN A V.Face recognition based on multi-class mapping of Fisher scores[J].Pattern Recognition,2005,38:799-811.
9YANG J,GAO X M.Kernel ICA:an alternative formulation and its application to face recognition[J].Pattern Recognition,2005,38:1784-1787.
10MATSUI T,FURUI S.N-best-based unsupervised speaker adaptation for speech recognition[J].Computer Speech and Language,1998,12:41-50

引证文献3

1张芸,李昕,郑宇,杨庆涛.一种基于Fisher准则的说话人识别方法研究[J].兰州大学学报（自然科学版）,2007,43(2):92-97. 被引量：5
2邢玉娟,谭萍,李明.一种新的说话人识别序列特征提取方法[J].兰州理工大学学报,2009,35(4):98-102. 被引量：4
3倪纪伟,彭妙颜.基于Fisher比的Bark倒谱系数混合特征参数提取方法[J].电声技术,2019,43(1):30-33. 被引量：4

二级引证文献13

1云健,宋馨,王春霞,刘民钢.一种基于HMMNN的说话人识别模型[J].上海师范大学学报（自然科学版）,2009,38(4):394-397.
2刘亚丽,杨鸿武,黄德智.基于加权Mel倒谱系数的说话人识别[J].计算机应用与软件,2009,26(9):24-27. 被引量：3
3王志兰.基于小波包分析和支持向量机的说话人识别[J].佳木斯大学学报（自然科学版）,2010,28(6):873-875.
4刘宏,刘立群.改进的美尔倒谱系数用于说话人识别研究[J].计算机工程与应用,2012,48(8):155-157. 被引量：3
5林珠,邢延.数据挖掘中适用于分类的时序数据特征提取方法[J].计算机系统应用,2012,21(10):224-229. 被引量：12
6鲜晓东,樊宇星.基于Fisher比的梅尔倒谱系数混合特征提取方法[J].计算机应用,2014,34(2):558-561. 被引量：18
7吴文昭.基于多约简α-GMM和SVM的说话人确认[J].兰州理工大学学报,2015,41(4):113-116. 被引量：1
8谭萍,邢玉娟.基于GMM超向量和Fisher-稀疏表示分类的说话人确认[J].青海大学学报（自然科学版）,2016,34(1):51-57. 被引量：2
9陈勇,汪汉国,钱坤,李永.嵌入式智能家居人机交互控制系统设计[J].数码世界,2017,0(9):158-160.
10陈旭,蒋晔.基于高斯滤波器组混合特征的录音回放攻击检测研究[J].计算机工程,2021,47(3):291-297. 被引量：3

1汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
2柳革命,孙超,陈建莉.基于局域判别基空间能量的特征提取[J].空军工程大学学报（自然科学版）,2008,9(1):33-36. 被引量：2
3谢德光,张贤达,李细林.类相关时频分布在雷达目标识别中的应用[J].系统工程与电子技术,2008,30(11):2132-2134.
4刘卫东,陶锐.声发射信号分类研究[J].电声技术,2008,32(11):35-38.
5李会勇,何子述.一种MIMO通信系统的非线性译码算法及仿真[J].系统仿真学报,2009,21(7):1856-1858.
6胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：23
7刘顺兰,张鹏.次分量分析恒模盲多用户检测算法[J].杭州电子科技大学学报（自然科学版）,2011,31(4):69-72.
8李晋徽,杨俊安,项要杰.基于高斯滤波器及费舍尔准则的特征提取方法[J].电路与系统学报,2013,18(2):400-404. 被引量：2
9柳革命,孙超,刘兵,杨益新.局域判别基空间能量的水声目标特征提取[J].声学技术,2007,26(6):1089-1093. 被引量：4
10魏国华,郑继明.基于局域判别基的音频信号特征提取方法[J].计算机应用与软件,2009,26(11):84-87. 被引量：2

电路与系统学报

2002年第1期

浏览历史

内容加载中请稍等...

结合主分量分析及Fisher准则的说话人识别方法研究被引量：3

参考文献1

共引文献60

同被引文献21

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

结合主分量分析及Fisher准则的说话人识别方法研究 被引量：3

参考文献1

共引文献60

同被引文献21

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

结合主分量分析及Fisher准则的说话人识别方法研究被引量：3