期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
融合面部识别与PLDA技术的大学生自闭症智能检测研究
1
作者 黄先伟 《延边大学学报(自然科学版)》 2025年第2期66-71,共6页
针对现有大学生自闭症检测方法存在的误检率和漏检率过高的问题,提出了一种融合面部识别与PLDA技术的大学生自闭症智能检测方法.该方法首先根据自闭症的典型行为特征,设定大学生自闭症检测标准;然后通过智能采集大学生面部图像数据,以... 针对现有大学生自闭症检测方法存在的误检率和漏检率过高的问题,提出了一种融合面部识别与PLDA技术的大学生自闭症智能检测方法.该方法首先根据自闭症的典型行为特征,设定大学生自闭症检测标准;然后通过智能采集大学生面部图像数据,以及在面部识别与PLDA技术的支持下,完成面部图像特征的提取、降维与融合;最后通过与设定标准特征进行匹配,得出大学生自闭症的智能检测结果.性能测试实验表明,该方法的误检率和漏检率分别为0.04%和0.08%,均低于现有的低秩表示判别域适应检测方法和I3D-CNN检测方法.因此,该方法可应用于大学生自闭症的检测中. 展开更多
关键词 面部识别 plda技术 大学生 自闭症 智能检测
在线阅读 下载PDF
基于T矩阵归一化PLDA的说话人确认
2
作者 缑新科 王跃 《计算机与现代化》 2017年第10期53-56,共4页
利用i-vector/PLDA模型进行说话人确认时,对于不定时间的语音,由于将长度归一化后的i-vector转化到PLDA模型时,伴随着不确定性的扭曲和缩放,影响识别率。本文通过对全变量空间矩阵T的列向量执行归一化,代替在PLDA模型上对i-vector进行... 利用i-vector/PLDA模型进行说话人确认时,对于不定时间的语音,由于将长度归一化后的i-vector转化到PLDA模型时,伴随着不确定性的扭曲和缩放,影响识别率。本文通过对全变量空间矩阵T的列向量执行归一化,代替在PLDA模型上对i-vector进行长度归一化,避免因在i-vector上执行长度归一化,导致转移到PLDA模型上产生不良的扭曲。实验结果表明,该方法得到和长度归一化相似的效果,部分效果要优于长度归一化。 展开更多
关键词 i-vector/plda 长度归一化 T矩阵 高斯通用背景模型
在线阅读 下载PDF
基于概率修正PLDA的说话人识别系统 被引量:4
3
作者 李琳 万丽虹 +2 位作者 洪青阳 张君 李明 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第8期692-696,共5页
为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度... 为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度.为验证基于概率修正PLDA模型的有效性,进行了NIST SRE10 corecore测试集在3种不同时长的评测实验,以及NIST 2014 i-vector machine learning challenge测试任务.结果表明,相较于传统的PLDA训练模型,通过语音时长的约束提高了说话人识别性能. 展开更多
关键词 高斯plda i-vector 语音时长 概率修正 说话人识别
在线阅读 下载PDF
一种基于2D-PLDA和小波子带的虹膜识别算法 被引量:4
4
作者 王相海 董钦科 《中国图象图形学报》 CSCD 北大核心 2011年第1期59-65,共7页
近年来,基于线性判别分析(LDA)的图像模式识别方法研究越来越受到人们的关注。然而LDA方法自身存在的小样本难题,极大的影响了样本集特征矩阵的获取。研究者随后提出的2维线性分析(2D-LDA)在一定程度上解决了这个问题。在传统2D-LDA基础... 近年来,基于线性判别分析(LDA)的图像模式识别方法研究越来越受到人们的关注。然而LDA方法自身存在的小样本难题,极大的影响了样本集特征矩阵的获取。研究者随后提出的2维线性分析(2D-LDA)在一定程度上解决了这个问题。在传统2D-LDA基础上,提出一种改进的2维线性分析方法——2D-PLDA,该方法通过对样本集进行预分类,使得散布矩阵更加合理;在此基础上将2D-PLDA和离散小波相结合,应用于虹膜识别中。实验结果证明,该算法在识别精度和计算复杂度等方面均较传统LDA和2D-LDA方法有很大的改进,同时采用小波的不同子带作为输入空间也在一定程度上增加了算法的鲁棒性。 展开更多
关键词 虹膜识别 2D LDA 2D—plda 小波子带 特征矩阵
原文传递
基于BIC和G_PLDA的说话人分离技术研究 被引量:7
5
作者 李锐 卓著 李辉 《中国科学技术大学学报》 CAS CSCD 北大核心 2015年第4期286-293,共8页
传统的以贝叶斯信息准则(Bayesian information criterion,BIC)作为相似性度量的说话人分离技术,在短时对话的分离任务中能取得较好的效果,但是随着对话时长的增加,BIC的单高斯模型不足以描述不同说话人数据的分布,且层次聚类(Hierarchi... 传统的以贝叶斯信息准则(Bayesian information criterion,BIC)作为相似性度量的说话人分离技术,在短时对话的分离任务中能取得较好的效果,但是随着对话时长的增加,BIC的单高斯模型不足以描述不同说话人数据的分布,且层次聚类(Hierarchical agglomerative clustering,HAC)时,区分相同说话人和不同说话人的门限值难以划定.针对此问题,提出基于短时BIC和长时G_PLDA的融合方法,充分利用BIC在短时聚类的可靠性和G_PLDA在长时段上的优异区分性,在美国国家标准技术局(NIST)08Summed测试集上的实验表明,该方法将分类错误率(DER)从BIC基线系统的2.34%降到1.54%,性能相对提升34.2%. 展开更多
关键词 说话人分离 贝叶斯信息准则 高斯概率线性判别分析 分类错误率
在线阅读 下载PDF
PLDA:AS级的Internet拓扑生成算法 被引量:1
6
作者 朱志伯 高飞 《计算机工程》 CAS CSCD 北大核心 2010年第7期115-118,共4页
Internet拓扑建模是进行Internet研究的基础。PLOD是一种AS级的Internet拓扑生成算法,但PLOD算法不能保证生成拓扑图的连通性,且存在"出度贷款过剩"现象。对PLOD算法进行改进,提出PLDA算法。在AS节点连接时添加连通性检测,并... Internet拓扑建模是进行Internet研究的基础。PLOD是一种AS级的Internet拓扑生成算法,但PLOD算法不能保证生成拓扑图的连通性,且存在"出度贷款过剩"现象。对PLOD算法进行改进,提出PLDA算法。在AS节点连接时添加连通性检测,并对出度大的AS节点实行优先连接,较好地解决PLOD算法存在的问题。实验结果表明,PLDA算法是有效可行的。 展开更多
关键词 拓扑建模 出度贷款过剩 plda算法
在线阅读 下载PDF
I-vector聚类字典及注意力机制框架的说话人自适应 被引量:5
7
作者 黄俊 蒋兵 +2 位作者 李先刚 郭武生 戴礼荣 《小型微型计算机系统》 CSCD 北大核心 2019年第2期460-464,共5页
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注... 近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注意力机制的自适应框架,测试时能够在不提取i-vector和不进行二遍解码的前提下快速实现线上自适应,并且该框架具有灵活性优和可扩展性好的优点,能够方便的用于其他类型的自适应,如地域自适应和性别自适应.在Switchboard任务上,实验结果表明我们提出的框架在不同的声学模型上相对于基线均有性能提升,并且通过说话人识别任务进一步证明了该方法的合理性. 展开更多
关键词 i-vector字典 注意力机制 说话人自适应 语音识别
在线阅读 下载PDF
基于DNN处理的鲁棒性I-Vector说话人识别算法 被引量:12
8
作者 王昕 张洪冉 《计算机工程与应用》 CSCD 北大核心 2018年第22期167-172,共6页
提出了一种将基于深度神经网络(Deep Neural Network,DNN)特征映射的回归分析模型应用到身份认证矢量(identity vector,i-vector)/概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)说话人系统模型中的方法。DNN通过... 提出了一种将基于深度神经网络(Deep Neural Network,DNN)特征映射的回归分析模型应用到身份认证矢量(identity vector,i-vector)/概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)说话人系统模型中的方法。DNN通过拟合含噪语音和纯净语音i-vector之间的非线性函数关系,得到纯净语音i-vector的近似表征,达到降低噪声对系统性能影响的目的。在TIMIT数据集上的实验验证了该方法的可行性和有效性。 展开更多
关键词 说话人识别 深度神经网络 i-vector
在线阅读 下载PDF
基于多特征I-Vector的说话人识别算法 被引量:2
9
作者 赵宏 岳鲁鹏 +1 位作者 常兆斌 王伟杰 《兰州理工大学学报》 CAS 北大核心 2021年第5期93-98,共6页
针对单一声学特征无法精准高效地辨识说话人身份的问题,提出了一种基于多特征I-Vector的说话人识别算法.该算法首先采集不同的声学特征并将其构成一个高维特征向量,然后通过主成分分析法有效地剔除高维特征向量的关联,确保各种特征之间... 针对单一声学特征无法精准高效地辨识说话人身份的问题,提出了一种基于多特征I-Vector的说话人识别算法.该算法首先采集不同的声学特征并将其构成一个高维特征向量,然后通过主成分分析法有效地剔除高维特征向量的关联,确保各种特征之间正交化,最后采用概率线性判别分析进行建模和打分,并在一定程度上降低空间维度.在TIMIT语料库上利用Kaldi进行实验,算法运行结果表明,该算法较当前流行的基于I-Vector的单一梅尔频率倒谱系数和感知线性预测系数的特征系统在等错误率上分别提高了8.18%和1.71%,在模型训练时间上分别减少了60.4%和47.5%,具有更好的识别效果和效率. 展开更多
关键词 说话人识别算法 多特征i-vector 主成分分析 概率线性判别分析 Kaldi
在线阅读 下载PDF
基于I-Vector的多核学习SVM的说话人确认系统 被引量:1
10
作者 龚铖 琚炜 《微型机与应用》 2017年第22期15-18,22,共5页
自I-Vector(身份认证矢量)被提出以来,基于I-Vector的说话人确认系统迅速取代了基于GMM超矢量的系统并开始流行。I-Vector-SVM系统作为其中之一,在通常训练样本较少的说话人确认领域有着独特的优势,但其性能受核函数影响较大。因此,基... 自I-Vector(身份认证矢量)被提出以来,基于I-Vector的说话人确认系统迅速取代了基于GMM超矢量的系统并开始流行。I-Vector-SVM系统作为其中之一,在通常训练样本较少的说话人确认领域有着独特的优势,但其性能受核函数影响较大。因此,基于多核学习(Multiple Kernel Learning,MKL)思想,构建了基于I-Vector的多核学习SVM说话人确认系统,并与I-VectorSVM基线系统进行了性能比较。基于NIST语料库的实验表明,基于I-Vector的多核学习说话人确认系统相对于基线系统可取得一定的性能提升。 展开更多
关键词 说话人确认 多核学习SVM i-vector
在线阅读 下载PDF
高斯PLDA在说话人确认中的应用及其联合估计 被引量:3
11
作者 许云飞 杨海 +1 位作者 周若华 颜永红 《自动化学报》 EI CSCD 北大核心 2014年第6期1068-1074,共7页
近年来,基于总变化因子的说话人识别方法成为说话人识别领域的主流方法.其中,概率线性鉴别分析(Probabilistic linear discriminant analysis,PLDA)因其优异的性能而得到学者们的广泛关注.然而,在估计PLDA模型时,传统的因子分析方法只... 近年来,基于总变化因子的说话人识别方法成为说话人识别领域的主流方法.其中,概率线性鉴别分析(Probabilistic linear discriminant analysis,PLDA)因其优异的性能而得到学者们的广泛关注.然而,在估计PLDA模型时,传统的因子分析方法只更新模型空间,因此,模型均值不能很好地与更新后的模型空间耦合.提出联合估计法对模型均值和模型空间同时估计,得到更为严格的期望最大化更新公式,在美国国家标准与技术局说话人识别评测2010扩展测试数据库以及2012核心测试数据库上,等错率得到一定提升. 展开更多
关键词 因子分析 总变化因子 概率线性鉴别分析 联合估计 期望最大化
在线阅读 下载PDF
基于改进MFD的I-Vector说话人识别 被引量:1
12
作者 李湾湾 范承志 祁才君 《电声技术》 2016年第12期43-48,共6页
基于I-Vector的说话人识别系统通常采用LDA进行信道补偿和特征降维,在开发集样本有限的情况下,LDA的区分性不强。基于此,提出一种改进I-Vector说话人确认算法。在话者样本数较少的情况下,以中值i向量代替均值i向量作为集中统计量可以减... 基于I-Vector的说话人识别系统通常采用LDA进行信道补偿和特征降维,在开发集样本有限的情况下,LDA的区分性不强。基于此,提出一种改进I-Vector说话人确认算法。在话者样本数较少的情况下,以中值i向量代替均值i向量作为集中统计量可以减少区分信息的丢失。随着样本数量增加,改进中值分类器,采用去最大最小值后求均值的方法作为i向量的集中趋势。用此方法计算类间与类内离散度矩阵后,对i向量进行信道补偿和降维。结合高斯PLDA模型,以LDA和WCCN为基线系统进行仿真对比。实验结果表明,提出的算法具有良好的区分性能,在有限的话者语音样本数量范围内,与基线相比能提升总和约3%的性能。 展开更多
关键词 说话人识别 i向量 plda模型 线性区分性分析 改进中值分类器 信道补偿
在线阅读 下载PDF
Hadoop环境下基于PLDA的图像场景分类方法研究 被引量:1
13
作者 李勋 高洁琼 +1 位作者 杨景玉 王松 《兰州交通大学学报》 CAS 2015年第6期81-86,共6页
针对大规模图像场景分类速度缓慢的问题,提出了一种Hadoop环境下基于PLDA的图像场景分类方法.首先利用Hadoop分布式存储系统HDFS存储图像数据;其次通过扩展MapReduce数据类型以及输入类型使得每幅图像作为一个MapReduce任务的数据处理单... 针对大规模图像场景分类速度缓慢的问题,提出了一种Hadoop环境下基于PLDA的图像场景分类方法.首先利用Hadoop分布式存储系统HDFS存储图像数据;其次通过扩展MapReduce数据类型以及输入类型使得每幅图像作为一个MapReduce任务的数据处理单元;然后利用MapReduce分布式提取图像SIFT特征,并使用Bag-of-Features模型将其转化成词频向量;最后使用MapReduce实现了PLDA算法,并在此基础上完成了Hadoop环境下基于PLDA的图像场景分类.实验结果表明,该方法能够充分利用MapReduce的分布式特性,在分类结果合理的情况下,大幅提高了图像场景的分类速度. 展开更多
关键词 图像场景分类 plda HADOOP MAPREDUCE SIFT BOF
在线阅读 下载PDF
基于PLDA的多信道多语音说话人确认研究 被引量:3
14
作者 许云飞 周若华 颜永红 《网络新媒体技术》 2014年第1期13-19,共7页
在NIST SRE 2012年评测和实际应用中,可以用说话人的多个语音样本来注册说话人模型,并且这些语音样本取自于各种各样的信道。本文基于PLDA,尝试了多种打分方法,并提出一种新的得分规整技术,在NIST SRE 2012核心测试集上,EER平均提升26.0... 在NIST SRE 2012年评测和实际应用中,可以用说话人的多个语音样本来注册说话人模型,并且这些语音样本取自于各种各样的信道。本文基于PLDA,尝试了多种打分方法,并提出一种新的得分规整技术,在NIST SRE 2012核心测试集上,EER平均提升26.0%,MinCost平均提升12.4%。 展开更多
关键词 说话人识别 plda 多语音 得分规整
在线阅读 下载PDF
基于贝叶斯主成分分析的i-vector说话人确认方法 被引量:2
15
作者 肜娅峰 陈晨 +1 位作者 陈德运 何勇军 《电子学报》 EI CAS CSCD 北大核心 2021年第11期2186-2194,共9页
身份-矢量(identity-vector,i-vector)方法作为说话人确认领域中的主流方法之一,能够通过学习总变化空间来获取有效的低维说话人特征——i-vector特征.但是当开发集数据不充足时,会导致学习到的总变化空间模型误差较大;同时,还无法有效... 身份-矢量(identity-vector,i-vector)方法作为说话人确认领域中的主流方法之一,能够通过学习总变化空间来获取有效的低维说话人特征——i-vector特征.但是当开发集数据不充足时,会导致学习到的总变化空间模型误差较大;同时,还无法有效确认此时的总变化空间是否因为预先设置的维度过高而学到了冗余信息.为此,本文将贝叶斯主成分分析(Bayesian Principal Component Analysis,BPCA)引入总变化空间的学习过程中,利用其来为总变化空间引入更多的先验信息,从而对开发集数据中包含的信息进行补充,并在先验信息的约束下削弱总变化空间中无效维的影响.实验结果表明,当开发集数据不充足时,相比于传统的总变化空间学习方法,BPCA方法能够有效提升说话人确认系统的识别性能. 展开更多
关键词 说话人确认 身份-矢量(i-vector) 总变化空间 贝叶斯主成分分析
在线阅读 下载PDF
基于PLDA的说话人识别时变鲁棒性问题研究 被引量:1
16
作者 陈霄鹏 彭亚雄 贺松 《微型机与应用》 2016年第5期58-60,64,共4页
随着时间的变化,人的声音也会发生变化。这对说话人的识别带来了一定的影响。通过研究发现,说话人识别的性能与时间有着线性变化的规律。传统的说话人识别系统使用GMM-UBM模型并不能很好地学习出线性变化规律。由于概率线性判别分析(PL... 随着时间的变化,人的声音也会发生变化。这对说话人的识别带来了一定的影响。通过研究发现,说话人识别的性能与时间有着线性变化的规律。传统的说话人识别系统使用GMM-UBM模型并不能很好地学习出线性变化规律。由于概率线性判别分析(PLDA)对于类内与类间有着很好的线性区分度,所以为了解决线性变化的问题,选择概率线性判别分析的方法学习说话人识别中时变的线性变化规律。从实验结果看出,PLDA对于说话人识别的识别鲁棒性具有很好的提升。 展开更多
关键词 说话人识别 时变鲁棒性 GMM-UBM plda
在线阅读 下载PDF
基于i-vector全局参数联合的说话人识别 被引量:1
17
作者 杨明亮 龙华 +1 位作者 邵玉斌 杜庆治 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2021年第1期144-151,共8页
以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(universal background,UB)... 以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(universal background,UB)数据与训练数据耦合性的问题导致模型性能不佳。提出了基于i-vector全局参数联合(global parameter joint of identify vector,GPJ-IV)的说话人识别方法。该方法利用背景说话人特征训练得到说话人通用背景模型(universal background model,UBM),构建基于全局联合差异空间和联合信道补偿的GPJ-IV模型。通过实验测试并与传统方法进行对比,实验结果显示,所提出的GPJ-IV模型相比i-vector模型,等错误率(equal error rate,EER)和最小检测代价函数(minimum detection cost function,MinDCF)性能分别提升了58.99%和15.9%。 展开更多
关键词 i-vector模型 全局联合差异空间 GPJ-IV模型 说话人识别
在线阅读 下载PDF
基于i-vector和深度学习的说话人识别 被引量:12
18
作者 林舒都 邵曦 《计算机技术与发展》 2017年第6期66-71,共6页
为了提高说话人识别系统的性能,在研究基础上提出了一种将深度神经网络(Deep Neural Nerwork,DNN)模型成果与i-vector模型相结合的新方案。该方案通过有效的神经网络构建,准确地提取了说话人语音里的隐藏信息。尽管DNN模型可以帮助挖掘... 为了提高说话人识别系统的性能,在研究基础上提出了一种将深度神经网络(Deep Neural Nerwork,DNN)模型成果与i-vector模型相结合的新方案。该方案通过有效的神经网络构建,准确地提取了说话人语音里的隐藏信息。尽管DNN模型可以帮助挖掘很多信息,但是i-vector特征并没有完全覆盖住声纹特征的所有维度。为此,在i-vector特征的基础上继续提取维数更高的i-supervector特征,有效地避免了信息的不必要损失。为证明提出方案的可行性,采用对TIMIT等语音数据库630个说话人的语音进行了训练、验证和测试。验证实验结果表明,在提取i-vector特征的基础上提取i-supervector特征的说话人识别同等错误率有30%的降低,是一种有效的识别方法。 展开更多
关键词 说话人识别 深度神经网络 i-vector 声纹特征
在线阅读 下载PDF
基于多特征i-vector的短语音说话人识别算法 被引量:7
19
作者 孙念 张毅 +1 位作者 林海波 黄超 《计算机应用》 CSCD 北大核心 2018年第10期2839-2843,共5页
当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vec... 当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vector的短语音说话人识别算法。该算法首先提取不同的声学特征向量组合成一个高维特征向量,然后利用主成分分析(PCA)去除高维特征向量的相关性,使特征之间正交化,最后采用线性判别分析(LDA)挑选出最具区分性的特征,并且在一定程度上降低空间维度,从而实现更好的说话人识别性能。结合TIMIT语料库进行实验,同一时长的短语音(2 s)条件下,所提算法比基于i-vector的单一的梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、感知对数面积比系数(PLAR)特征系统在等错误率(EER)上分别有相对72. 16%、69. 47%和73. 62%的下降。不同时长的短语音条件下,所提算法比基于i-vector的单一特征系统在EER和检测代价函数(DCF)上大致都有50%的降低。基于以上两种实验的结果充分表明了所提算法在短语音说话人识别系统中可以充分提取说话人的个性信息,有利地提高说话人识别性能。 展开更多
关键词 说话人识别 i-vector 短语音 多特征 主成分分析 线性判别分析
在线阅读 下载PDF
用说话人相似度i-vector的非负值矩阵分解说话人聚类 被引量:1
20
作者 哈尔肯别克.木哈西 钟珞 达瓦.伊德木草 《计算机应用与软件》 2017年第4期165-168,242,共5页
基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话... 基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话人模型用GMM方法建立,发话语音时间短暂时GMM的信赖性降低,最终影响说话人聚类精度。针对上述问题,提出引用i-vector说话人相似度的非负值矩阵分解的高精度快速说话人聚类方法。 展开更多
关键词 说话人分割及聚类 非负值矩阵分解 i-vector GMM 电话语音
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部