期刊文献+
共找到802篇文章
< 1 2 41 >
每页显示 20 50 100
Automatic Speaker Recognition Using Mel-Frequency Cepstral Coefficients Through Machine Learning 被引量:1
1
作者 U˘gur Ayvaz Hüseyin Gürüler +3 位作者 Faheem Khan Naveed Ahmed Taegkeun Whangbo Abdusalomov Akmalbek Bobomirzaevich 《Computers, Materials & Continua》 SCIE EI 2022年第6期5511-5521,共11页
Automatic speaker recognition(ASR)systems are the field of Human-machine interaction and scientists have been using feature extraction and feature matching methods to analyze and synthesize these signals.One of the mo... Automatic speaker recognition(ASR)systems are the field of Human-machine interaction and scientists have been using feature extraction and feature matching methods to analyze and synthesize these signals.One of the most commonly used methods for feature extraction is Mel Frequency Cepstral Coefficients(MFCCs).Recent researches show that MFCCs are successful in processing the voice signal with high accuracies.MFCCs represents a sequence of voice signal-specific features.This experimental analysis is proposed to distinguish Turkish speakers by extracting the MFCCs from the speech recordings.Since the human perception of sound is not linear,after the filterbank step in theMFCC method,we converted the obtained log filterbanks into decibel(dB)features-based spectrograms without applying the Discrete Cosine Transform(DCT).A new dataset was created with converted spectrogram into a 2-D array.Several learning algorithms were implementedwith a 10-fold cross-validationmethod to detect the speaker.The highest accuracy of 90.2%was achieved using Multi-layer Perceptron(MLP)with tanh activation function.The most important output of this study is the inclusion of human voice as a new feature set. 展开更多
关键词 Automatic speaker recognition human voice recognition spatial pattern recognition mfccs SPECTROGRAM machine learning artificial intelligence
在线阅读 下载PDF
基于改进MFCC特征提取和DNN网络的机器人语音识别方法研究 被引量:3
2
作者 秦垲忻 王炜昕 王砚生 《计算机测量与控制》 2025年第2期246-253,共8页
为了实现机器人语音控制,并避免环境噪音的干扰,研究提出了基于改进MFCC特征提取和深度神经网络的机器人语音控制指令识别方法;该方法利用线性判别分析、最大似然线性变换和说话人自适应变换对MFCC特征进行处理,获得了新的语音特征;同... 为了实现机器人语音控制,并避免环境噪音的干扰,研究提出了基于改进MFCC特征提取和深度神经网络的机器人语音控制指令识别方法;该方法利用线性判别分析、最大似然线性变换和说话人自适应变换对MFCC特征进行处理,获得了新的语音特征;同时通过深度玻尔兹曼机对声学模型进行了改进,并利用深度神经网络和谐波增强技术构建了语音增强方法;实验结果显示,研究提出的基于改进Mel频率倒谱系数特征能显著降低语音识别的字错误率,通过辅以改进深度神经网络-隐马尔科夫模型能进一步降低字错误率;在20 dB条件下,该特征和改进深度神经网络-隐马尔科夫模型的平均字错误率分别为24.9%和22.1%,均低于其他方法;上述结果表明,研究提出的语音识别方法能实现带噪声语音的准确识别,提高机器人的语音控制指令识别能力。 展开更多
关键词 语音识别 语音增强 声学模型 mfcc特征 DNN
在线阅读 下载PDF
基于改进MFCC-OCSVM和贝叶斯优化BiGRU的GIS异常工况声纹识别算法 被引量:4
3
作者 庄小亮 李乾坤 +3 位作者 刘紫罡 张禄亮 季天瑶 张长虹 《南方电网技术》 北大核心 2025年第1期30-40,共11页
为了准确识别气体绝缘开关柜(gas insulated switchgear,GIS)设备的异常工况,提出了一种基于加权梅尔频率谱系数单类支持向量机(Mel frequency cestrum coefficient-one class support vector machine,MFCC-OCSVM)和贝叶斯优化的门控循... 为了准确识别气体绝缘开关柜(gas insulated switchgear,GIS)设备的异常工况,提出了一种基于加权梅尔频率谱系数单类支持向量机(Mel frequency cestrum coefficient-one class support vector machine,MFCC-OCSVM)和贝叶斯优化的门控循环单元(bidirectional gate recurrent unit,BiGRU)声纹识别算法。首先,利用基于F统计量的MFCC对声纹数据进行加权特征提取,突出重要特征并减弱噪声的影响,然后利用OCSVM对加权后的特征进行异常检测并去除异常值,提高数据质量。为解决样本不平衡问题,采用合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)进行声纹样本的均衡。最后,应用基于贝叶斯优化的BiGRU模型进行声纹识别。以某气体绝缘全封闭组合电器(gas insulated switchgear,GIS)为例,采集了20类不同工况下操纵机构的声音样本,与多种经典分类模型进行对比。结果显示,所提算法取得的最高平均识别准确率达到了92.8%,相比于自适应增强、朴素贝叶斯和线性判别分析算法分别提升了30.1%、14.7%和11.5%。通过消融实验进一步评估和验证了所提算法各个流程对声纹识别的实际效果和性能影响,研究成果可为GIS设备异常工况的声纹识别提供高效技术路线。 展开更多
关键词 GIS设备 梅尔频谱倒谱系数 单类支持向量机 双向门控循环单元 声纹识别 贝叶斯优化
在线阅读 下载PDF
基于MFCC和HSMM的加工过程信号状态标记
4
作者 姜东升 周焮钊 李雄伟 《机床与液压》 北大核心 2025年第12期81-86,共6页
针对加工过程中加工信号自动状态标记困难的问题,结合梅尔倒谱系数(MFCC)和隐半马尔科夫模型(HSMM),提出一种适用于单一参数加工场景的模型。该模型通过对振动信号进行预处理和特征提取,利用Baum-Welch算法估计隐半马尔科夫模型的参数,... 针对加工过程中加工信号自动状态标记困难的问题,结合梅尔倒谱系数(MFCC)和隐半马尔科夫模型(HSMM),提出一种适用于单一参数加工场景的模型。该模型通过对振动信号进行预处理和特征提取,利用Baum-Welch算法估计隐半马尔科夫模型的参数,并基于给定的观测序列采用Viterbi方法进行预测,从而根据状态序列得到分割边界,实现信号的标记。在此基础上,搭建基于MFCC和线性判别分析(LDA)降维的隐半马尔可夫(HSMM)时序信号状态标记模型,同时采用查准率P、查全率R以及边界准确性F_(B)等指标来全面评估模型在信号标记任务中的表现。最后验证了MFCC-HSMM模型在单一参数场景下进行信号状态标记的有效性。 展开更多
关键词 信号标记 时序信号 序列标记 mfcc-HSMM
在线阅读 下载PDF
基于MFCC的越剧念白相似度比较
5
作者 陈圣宣 林捷 徐维阳 《信息化研究》 2025年第4期1-4,26,共5页
本研究基于梅尔倒谱系数对越剧念白声学特征进行余弦相似度比较。结果表明,不同演员对同一念白的演绎呈现分区分布特征,其中相似度大于0.8的个体被认为具有高度相似的念白演唱风格。值得注意的是,谢群英在不同文本中的念白相似度高达0.... 本研究基于梅尔倒谱系数对越剧念白声学特征进行余弦相似度比较。结果表明,不同演员对同一念白的演绎呈现分区分布特征,其中相似度大于0.8的个体被认为具有高度相似的念白演唱风格。值得注意的是,谢群英在不同文本中的念白相似度高达0.85,表明其演唱风格具有较强的稳定性,可作为特定流派的念白演唱参考样本。进一步的声学分析表明,越剧念白在不同演员之间表现出一定程度的趋同性,反映出该艺术形式在传承过程中可能受到严格的模仿训练。本研究提出的基于MFCC的念白分析方法,为越剧乃至其他戏曲剧种的数字化传承提供了一种可量化的研究路径,并对非物质文化遗产的保护与创新具有一定的实践价值。 展开更多
关键词 越剧念白 mfcc 相似度比较 非遗传承
在线阅读 下载PDF
融合Mel频谱图与MFCC的鸟鸣声纹建模方法研究
6
作者 周紫璇 刘琰 +1 位作者 马文翀 袁可如 《信息记录材料》 2025年第12期99-102,147,共5页
针对鸟鸣声纹识别中存在的数据不平衡、环境噪声干扰、声纹复杂性以及小样本学习等问题,本文提出了一种融合对数梅尔频率(Log-Mel)频谱图与梅尔(Mel)频率倒谱系数(MFCC)的鸟鸣声纹建模方法。首先,利用Log-Mel频谱图获取鸟鸣声的时频结... 针对鸟鸣声纹识别中存在的数据不平衡、环境噪声干扰、声纹复杂性以及小样本学习等问题,本文提出了一种融合对数梅尔频率(Log-Mel)频谱图与梅尔(Mel)频率倒谱系数(MFCC)的鸟鸣声纹建模方法。首先,利用Log-Mel频谱图获取鸟鸣声的时频结构特征,准确捕捉动态变化;其次,利用MFCC提取更加紧凑的特征,增强对背景噪声和环境变化的适应性;最后,开展了通过声纹识别鸟类的实验。实验结果表明:融合Log-Mel频谱图与MFCC的鸟鸣声纹建模方法有效提升了特征表达的完整性和区分度,在鸟鸣声的识别中表现出卓越的准确率和鲁棒性。 展开更多
关键词 鸟鸣声识别 对数梅尔频率(Log-Mel)频谱图 频率倒谱系数(mfcc) 特征融合 VGG16 卷积神经网络 生态监测 数据增强
在线阅读 下载PDF
融合MFCC和Wav2vec特征的对话情感识别方法
7
作者 刘旭东 王坤侠 《湖南工业大学学报》 2025年第6期29-36,共8页
针对语音信号传统手工特征动态信息捕捉不足的问题,引入Wav2vec 2.0模型以提取语音信号中的长距离依赖关系,并通过特征融合方式得到充分的情感特征表示。通过提取语音信号中最具有代表性的MFCC特征,且用Wav2vec提取特征以弥补MFCC在动... 针对语音信号传统手工特征动态信息捕捉不足的问题,引入Wav2vec 2.0模型以提取语音信号中的长距离依赖关系,并通过特征融合方式得到充分的情感特征表示。通过提取语音信号中最具有代表性的MFCC特征,且用Wav2vec提取特征以弥补MFCC在动态信息捕捉上的不足,获得了更为丰富和具有代表性的语音情感特征。通过对交叉注意力机制的运用,将语音声学特征与上下文信息进行融合,以获得更加全面和准确的特征表示。最终,通过Transformer网络实现了对情感状态的精准预测。通过在MELD和EEIDB数据集上进行实验,得知本文提出的方法在加权F1-Score指标上分别达到了44.32%和65.50%,从而验证了其有效性和优越性。 展开更多
关键词 手工特征 长距离 特征融合 上下文信息 对话情感识别 梅尔频率倒谱系数
在线阅读 下载PDF
说话人识别中MFCC参数提取的改进 被引量:29
8
作者 胡政权 曾毓敏 +1 位作者 宗原 李梦超 《计算机工程与应用》 CSCD 2014年第7期217-220,共4页
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表... 在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。 展开更多
关键词 mfcc参数 频谱重建 说话人识别
在线阅读 下载PDF
基于改进LPCC和MFCC的汉语耳语音识别 被引量:17
9
作者 荣薇 陶智 +1 位作者 顾济华 赵鹤鸣 《计算机工程与应用》 CSCD 北大核心 2007年第30期213-216,共4页
以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得... 以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得出的识别率为94.5%。 展开更多
关键词 耳语音 语音识别 LPCC参数 mfcc参数
在线阅读 下载PDF
基于MFCC的语音情感特征提取研究 被引量:29
10
作者 李虹 徐小力 +2 位作者 吴国新 丁春艳 赵学梅 《电子测量与仪器学报》 CSCD 北大核心 2017年第3期448-453,共6页
为了研究"世界记忆遗产"东巴经典古籍的音频分类,以通过语音情感特征提取的方法分类鉴别东巴音频类别,并实现对东巴经典语音的情感状态识别,同时提高人机交互性能,提出采用Mel频率倒谱系数(MFCC)实现语音情感特征的提取。通... 为了研究"世界记忆遗产"东巴经典古籍的音频分类,以通过语音情感特征提取的方法分类鉴别东巴音频类别,并实现对东巴经典语音的情感状态识别,同时提高人机交互性能,提出采用Mel频率倒谱系数(MFCC)实现语音情感特征的提取。通过引入MFCC的一阶差分、二阶差分描述语音特征的动态特征,并整合短时能量特征,最终形成MFCC和短时能量相叠加的语音信号特征参数,达到提取反映语音情感特征的目的。实验验证表明,该语音信号特征提取方法能够更明显地区分出包含在语音中的情感信息,为语音情感特征的识别研究及东巴古籍音频分类鉴别提供理论基础。 展开更多
关键词 东巴古籍 语音情感特征 特征参数 mfcc 短时能量
在线阅读 下载PDF
基于MFCC与神经网络的小蠹声音种类自动鉴别 被引量:11
11
作者 罗茜 王鸿斌 +1 位作者 张真 孔祥波 《北京林业大学学报》 CAS CSCD 北大核心 2011年第5期81-85,共5页
昆虫发出的各种声音具有种间特异性,是非常可靠的分类依据。利用这一特性,本实验旨在探索一种对昆虫自动分类的新方法。本实验录制了红脂大小蠹、云南切梢小蠹、短毛切梢小蠹和华山松大小蠹4种小蠹虫的胁迫声,利用Adobe Adition2.0对每... 昆虫发出的各种声音具有种间特异性,是非常可靠的分类依据。利用这一特性,本实验旨在探索一种对昆虫自动分类的新方法。本实验录制了红脂大小蠹、云南切梢小蠹、短毛切梢小蠹和华山松大小蠹4种小蠹虫的胁迫声,利用Adobe Adition2.0对每个声音文件进行降噪,再将其截取成只含有一个脉冲组的声音片段。在MATLAB环境下对这些声音片段进行端点监测并提取12维的MFCC(Mel频率倒谱系数),然后将此特征参数输入BP神经网络进行训练和检测。设置训练样本数为20、40、60、80、100,4种小蠹检测样本数分别为54、95、54、50,结果显示识别率随着训练样本数的增加而提高,在训练样本量为100时的最高识别率达到98.14%,平均识别率为93.29%,收到了较好的效果。为了验证小蠹种类数对识别率的影响,本实验对4种小蠹进行了两两比较,结果显示总体上高于4种一起识别的结果。 展开更多
关键词 小蠹 声音 识别 神经网络 mfcc
在线阅读 下载PDF
高阶MFCC的话者识别性能及其噪声鲁棒性 被引量:14
12
作者 李霄寒 戴蓓倩 +1 位作者 方绍武 刘鸣 《信号处理》 CSCD 2001年第2期124-129,共6页
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量。本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系... 在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量。本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性。基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量。实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性。 展开更多
关键词 高阶mfcc 话者识别 噪声鲁棒性 语音信号处理
在线阅读 下载PDF
基于修正MFCC参数汉语耳语音的话者识别 被引量:24
13
作者 林玮 杨莉莉 徐柏龄 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第1期54-62,共9页
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提... 耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 展开更多
关键词 耳语音 话者识别 mfcc参数 隐马尔可夫模型
在线阅读 下载PDF
噪声鲁棒性说话人识别语音高频加权MFCC提取 被引量:15
14
作者 陈迪 龚卫国 李波 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第3期668-672,共5页
本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而... 本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而保留更多高次谐波信息。将语音频谱能量高频部分进行加权,则可使语音增强,提高语音鲁棒性。该方法被用于基音同步预处理MFCC参数提取中,并进行了说话人确认实验。实验结果表明,即使在信噪比较低的情况下,该方法都会在一定程度上提高多种噪声环境下的说话人确认识别率。 展开更多
关键词 高频加权 说话人确认 基音同步 鲁棒性 mfcc
在线阅读 下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
15
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 Mel频率倒谱系数(mfcc) 增减分量法 特征提取
在线阅读 下载PDF
基于MFCC的语音情感识别 被引量:25
16
作者 韩一 王国胤 杨勇 《重庆邮电大学学报(自然科学版)》 2008年第5期597-602,共6页
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别... 情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。 展开更多
关键词 mfcc 语音情感识别 情感计算
在线阅读 下载PDF
基于MFCC参数和HMM的低空目标声识别方法研究 被引量:20
17
作者 刘辉 杨俊安 许学忠 《弹箭与制导学报》 CSCD 北大核心 2007年第5期217-219,222,共4页
提出了一种战场声目标识别方法,模拟人耳的听觉机理提取更能反应出声音信号动态特征的Mel倒谱系数(MFCC)作为识别战场低空目标的参数;利用隐马尔可夫过程具有很强地表征时变信号的能力来表现声信号随时间变化呈现出的模式演变现象,建立... 提出了一种战场声目标识别方法,模拟人耳的听觉机理提取更能反应出声音信号动态特征的Mel倒谱系数(MFCC)作为识别战场低空目标的参数;利用隐马尔可夫过程具有很强地表征时变信号的能力来表现声信号随时间变化呈现出的模式演变现象,建立隐马尔可夫模型(HMM);由K-均值聚类得出HMM模型的训练和识别特征向量,识别时设定阈值判定输入的未知声信号。实际数据的分析结果表明了该识别方法的准确性与有效性。 展开更多
关键词 声目标识别 HMM mfcc
在线阅读 下载PDF
基于语音频谱包络抽取的MFCC算法 被引量:4
18
作者 李波 王成友 +2 位作者 杨聪 蔡宣平 张尔扬 《国防科技大学学报》 EI CAS CSCD 北大核心 2004年第4期42-45,共4页
MFCC可以更加准确地表示语音低频处的频谱包络,在语音转换中是一种很好的频谱包络表示方法;提出一种新的有效的求解MFCC的算法,先对频谱通过谐波抽取得到阶梯谱包络,再对阶梯谱包络进行Mel尺度变换,最后通过余弦变换求得MFCC参数。该方... MFCC可以更加准确地表示语音低频处的频谱包络,在语音转换中是一种很好的频谱包络表示方法;提出一种新的有效的求解MFCC的算法,先对频谱通过谐波抽取得到阶梯谱包络,再对阶梯谱包络进行Mel尺度变换,最后通过余弦变换求得MFCC参数。该方法实现简单,运算结果准确。 展开更多
关键词 语音处理 mfcc 语音识别 说话人识别 语音转换
在线阅读 下载PDF
语音信号特征提取中Mel倒谱系MFCC的改进算法 被引量:29
19
作者 张震 王化清 《计算机工程与应用》 CSCD 北大核心 2008年第22期54-55,58,共3页
从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传... 从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传统算法在语音识别系统中的差别。 展开更多
关键词 语音识别 特征提取 mfcc
在线阅读 下载PDF
改进MFCC参数在非特定人语音识别中的研究 被引量:16
20
作者 田莎莎 唐菀 佘纬 《科技通报》 北大核心 2013年第3期139-142,146,共5页
随着信息时代的高速发展,人们越来越关注计算机的便携使用方式,以语音输入代替手动输入成为计算机未来发展的一个必然趋势。本文在MFCC特征参数的基础上,提出了一种改进MFCC特征参数--BMFCC特征参数,以提高原MFCC特征参数在语音识别时... 随着信息时代的高速发展,人们越来越关注计算机的便携使用方式,以语音输入代替手动输入成为计算机未来发展的一个必然趋势。本文在MFCC特征参数的基础上,提出了一种改进MFCC特征参数--BMFCC特征参数,以提高原MFCC特征参数在语音识别时的识别率和运算速度。BMFCC特征参数在进行参数的提取时,分为特征分量加权、特征分量求差分、主成分分析三个步骤。仿真实验结果表明,本文提出的BMFCC特征参数在识别率和有运算速度上均优于MFCC特征参数,且更具鲁棒性。 展开更多
关键词 mfcc参数 Bmfcc参数 语音识别 非特定人
在线阅读 下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部