基于聚类优化GMM提高说话人识别性能的研究被引量：3

A Study on GMM Optimization with Clustering for Improving Speaker Recognition

下载PDF

导出

摘要高斯混合模型(GMM)已广泛地应用于文本无关的说话人识别系统,该方法具有简单高效的特点。但如果GMM模型的高斯混合分量的数目比较多时,整个模型运算的复杂度会比较大。针对这个问题,提出将聚类算法和传统的高斯混合建模结合起来从而优化高斯混合模型,能够有效地提高说话人识别的速度。实验结果验证了这种算法的高效性。 Ganssian mixture model （GMM） has been widely used for text- independent speaker recognition. This method has simple and efficient character. However,if it has a large number of Gaussians in GMM, it leads to a large complexity of computation. To solve this problem, proposes a new method which combines classical GMM with clustering algorithm to optimize the GMM for reducing the complexity of computation. Experimental results demonstrated that our approach was quite efficient to reduce the complexity of computation.

作者吴庆棋林江云

机构地区厦门大学计算机科学系

出处《计算机技术与发展》 2009年第4期35-37,40,共4页 Computer Technology and Development

基金 "985工程"二期"信息技术"创新平台资助项目(0000-X07204)

关键词说话人识别高斯混合模型聚类算法 speaker recognition Gaussian mixture model clustering algorithm

分类号 TN92 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1Reynolds D A,Rose R C. Robust text- independent speaker identification using Gaussian mixture speaker models[J ]. IEEE Trans. Speech Audio Processing, 1995,3 (1) : 72 - 83.
2Reynolds D A. Speaker identification and verification using Gaussian mixture speaker models[ J ]. Speech Communication, 1995,17:91 - 108.
3Doddington G R, Przybocki M A,Martin A F,et al. The NIST speaker recognition evaluation - overview, methodology,systems, results, perspective [ J ]. Speech Communication, 2000,31:225 - 254.
4Yared G F G, Violaro F, Sousa L C. Gaussian elimination algorithm for HMM complexity reduction in continuous speech recognition systems [ C ]//Ninth European Conference on Speech Communication and Technology. Brazil: ISCA, 2005: 377 - 380.
5Fisher W, Zue V, Bernstein J, et al. An acoustic-phonetic database[C]//JASA, suppl. A. [s. l. ] : Is. n. ] ,1986.

同被引文献37

1何晓乾,陈雷霆,沈彬斌,房春兰.医学图像三维分割技术[J].计算机应用研究,2007,24(2):13-16. 被引量：16
2Kenny P,Boulianne G,Ouellet P,et alJoint factor analysis versus eigenchannels in speaker recognition[J].IEEE Transactions on Audin,Speech and Language Processing,2007,vol.15,no.4:1435-1447.
3Kuo-Hwei You,WANG Tai-wei.Combination of Autocorrelation-Based Features and Projection Measure Technique for Speaker IdentiGcation[J].IEEE Transactions on Speech and Audio Processing,2005,13(4):565-574.
4W.M.Campbell,D.A.Reynolds.Support Vector Machines Using GMM Supervecters for Speaekr Verification[J].IEEE,2006,13(5):308-311.
5C.Arun Kumar,B.Bharathi,T.Nagaranjan.A Discriminative GMM Technique using Product of Likelihood Gaussians[J].IEEE,2009,Page(s):1-6.
6Chi-Sang Jung,Mo Young Kim,Hong-Goo kang.Selecting Feature Frames for Automatic Speaker Recognition Using Mutual Information[J].IEEE Transactions on Audio,Speech and Language Processing,August 2010,18(6):1332-1340.
7Nagarajan T,Douglas 05haughnessy.Dicriminative MLE training using a product of Gaussian likelihood[J].in INTERSPEECH,2006.Pittsburgh,Pensylvania,USA,2006:601-604.
8H.C.Peng,F.Long,and C.Ding,'Feature selection based on mutual information:Criteria of max-dependency,max-relevance,and min-redundancy,lEEEtrans.Pattern Analysis and Machine Intel] igen,2005(27):1226-1238.
9Kim S,Yoon S W,Eriksson T,a1.A noise-robust pitch synchronous feature extraction algorithm for speaker recognition systems,in Proc.Eurospeech'05,2005.
10Wu T,Compernolle D,Duchateau J,et al.Maximum likelihood based temporal frame selection[J].in Proc.Int.ConfAcoust.Speech Signal Process.,2006,pp.349-352.

引证文献3

1孙彦群,俞一彪.基于有效特征集选择的说话人识别[J].电脑知识与技术,2011,7(4):2360-2362.
2翟继友,张鹏.高斯混合模型参数估值算法的优化[J].计算机技术与发展,2011,21(11):145-148. 被引量：8
3李嘉刚,李小宁,石杰,庄敏,陈戈.GrabCut在人体序列切片图像分割中的应用[J].计算机技术与发展,2011,21(12):246-249. 被引量：2

二级引证文献10

1王馨,王军生,赵红阳,王靖震.管线钢落锤撕裂实验断口的图像分割分析[J].辽宁科技大学学报,2013,36(6):578-582.
2王恩泽,何东健.基于MFCC和双重GMM的鸟类识别方法[J].计算机工程与设计,2014,35(5):1868-1871. 被引量：15
3周芹,茹国宝,余绍德,谢耀钦.基于GrabCut的三维医学图像分割[J].电视技术,2016,40(2):27-32. 被引量：4
4于建均,郑逸加,阮晓钢,赵少琼.基于高斯混合模型的轨迹模仿学习表征参数优化[J].北京工业大学学报,2017,43(5):719-728. 被引量：3
5李春生,宋佳,张可佳,张勇.基于关联度分析的生产异常模式挖掘[J].计算机技术与发展,2017,27(9):124-128.
6范晓东,崔莹,张庆春.基于EM算法的混合线性回归模型的应用研究[J].吉林化工学院学报,2020,37(7):10-12. 被引量：1
7代振,王平波,卫红凯.基于经验分布函数的EM估计初值选取[J].海军工程大学学报,2020,32(5):16-20. 被引量：1
8王素宁,朱俊杰,李志勇,黄宇星,李琪,田朝阳,陈凯锋.基于DTW算法的电力调度语音识别研究和应用[J].电力与能源,2021,42(1):35-38. 被引量：10
9吴刚,邱俊,祝谭雍,杜汶澎,刘旭政,李燊.基于改进PSO-GMM算法的伸缩缝纵向位移监测数据分析方法[J].长安大学学报(自然科学版),2025,45(6):97-106.
10蒋辉,马超群,许旭庆,兰秋军.仿EM的多变量缺失数据填补算法及其在信用评估中的应用[J].中国管理科学,2019,0(3):11-19. 被引量：16

1姜政,江铭炎.一种基于K-均值聚类优化的快速分形图像压缩算法[J].山东大学学报（工学版）,2006,36(3):22-25. 被引量：2
2武峥.聚类优化贝叶斯算法在手背静脉识别中的应用研究[J].信息技术与信息化,2016(1):153-156.
3曾禹,李鸥.一种新的跳频信号检测模型[J].电子学报,2012,40(4):832-837. 被引量：11
4姜政,江铭炎.一种基于K-均值聚类优化的快速分形图像压缩算法[J].电气电子教学学报,2006,28(2):44-46. 被引量：1
5刘海涛,陈涛,于海波.CPI GIV速调管管体结构及通道调谐方法[J].广播电视信息,2014,21(8):66-69.
6翟烁,石宇良.基于协同过滤改进的电子商务个性化推荐算法的研究[J].信息通信,2015,28(3):24-25.
7张洪波,张越月,赵钢.关于GIV速调管高功放通道调谐的有益探讨[J].广播与电视技术,2011,38(12):119-122.
8张红,郝东来.基于酉阵的MIMO系统空频编码方案[J].现代电子技术,2014,37(12):46-48.
9刘海涛,郭明,贾卫.GEN Ⅳ型速调管高功放系统结构及功能解析[J].广播电视信息,2015,22(2):72-75. 被引量：1
10张桂玲.运营商做OTT,需先革自己的命![J].通信世界,2015,0(13):28-28.

计算机技术与发展

2009年第4期

浏览历史

内容加载中请稍等...

基于聚类优化GMM提高说话人识别性能的研究被引量：3

参考文献5

同被引文献37

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于聚类优化GMM提高说话人识别性能的研究 被引量：3

参考文献5

同被引文献37

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于聚类优化GMM提高说话人识别性能的研究被引量：3