期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于GFCC特征提取机器人仿生声呐SLAM算法研究
1
作者 谢道平 于帅珍 武岳 《阜阳师范大学学报(自然科学版)》 2021年第3期67-72,共6页
针对移动机器人在室内环境下的定位问题,本文采用基于GFCC((Gammatone Frequency Cepstrum Coeffi-cient))特征提取BatSLAM模型,用指数压缩来模拟听觉系统的非线性特性,使用加海宁窗处理来减小回波信号所存在的边缘影响,使用离散余弦变... 针对移动机器人在室内环境下的定位问题,本文采用基于GFCC((Gammatone Frequency Cepstrum Coeffi-cient))特征提取BatSLAM模型,用指数压缩来模拟听觉系统的非线性特性,使用加海宁窗处理来减小回波信号所存在的边缘影响,使用离散余弦变换来对耳蜗图进行有损数据压缩,从而提高耳蜗图的抗干扰能力,使用升半正弦倒谱提升来提高耳蜗图的鲁棒性,通过GFCC特征提取可以有效提高室内定位的精度和准确性。实验表明,基于GFCC特征提取Bat-SLAM模型,通过提高耳蜗图的抗干扰性和鲁棒性,可以有效的较小定位误差,从而提高移动机器人的定位精度和准确性。 展开更多
关键词 SLAM 机器人 耳蜗图 仿生声呐传感器 gfcc特征提取
在线阅读 下载PDF
基于GFCC与RLS的说话人识别抗噪系统研究 被引量:5
2
作者 茅正冲 王正创 黄芳 《计算机工程与应用》 CSCD 北大核心 2015年第10期215-218,231,共5页
为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFC... 为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。 展开更多
关键词 抗噪系统 递归式最小均方(RLS) Grammatone频率倒谱系数(gfcc) 识别率
在线阅读 下载PDF
基于MFCC和GFCC混合特征的语音情感识别研究 被引量:10
3
作者 郭卉 姜囡 任杰 《光电技术应用》 2019年第6期34-39,共6页
针对MFCC滤波器存在语音高频信号泄露的问题,为避免基于MFCC特征对语音进行情感识别时存在有效情感特征丢失的局限性,结合MFCC的高准确性和GFCC的强鲁棒性,提出了基于MFCC与GFCC混合特征训练CNN对语音进行情感识别的方法,有效提高了语... 针对MFCC滤波器存在语音高频信号泄露的问题,为避免基于MFCC特征对语音进行情感识别时存在有效情感特征丢失的局限性,结合MFCC的高准确性和GFCC的强鲁棒性,提出了基于MFCC与GFCC混合特征训练CNN对语音进行情感识别的方法,有效提高了语音情感识别的准确率,改善了CNN模型的识别性能。实验结果表明,所设计的混合特征识别方法较传统识别方法识别率明显升高并达到了83%,实现了语言情感识别准确率的有效提升。 展开更多
关键词 MFCC gfcc 语音情感识别 CNN 混合特征
在线阅读 下载PDF
SRC:Superior Robustness of COVID-19 Detection from Noisy Cough Data Using GFCC 被引量:1
4
作者 Basanta Kumar Swain Mohammad Zubair Khan +1 位作者 Chiranji Lal Chowdhary Abdullah Alsaeedi 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期2337-2349,共13页
This research is focused on a highly effective and untapped feature called gammatone frequency cepstral coefficients(GFCC)for the detection of COVID-19 by using the nature-inspired meta-heuristic algorithm of deer hun... This research is focused on a highly effective and untapped feature called gammatone frequency cepstral coefficients(GFCC)for the detection of COVID-19 by using the nature-inspired meta-heuristic algorithm of deer hunting optimization and artificial neural network(DHO-ANN).The noisy crowdsourced cough datasets were collected from the public domain.This research work claimed that the GFCC yielded better results in terms of COVID-19 detection as compared to the widely used Mel-frequency cepstral coefficient in noisy crowdsourced speech corpora.The proposed algorithm's performance for detecting COVID-19 disease is rigorously validated using statistical measures,F1 score,confusion matrix,specificity,and sensitivity parameters.Besides,it is found that the proposed algorithm using GFCC performs well in terms of detecting the COVID-19 disease from the noisy crowdsourced cough dataset,COUGHVID.Moreover,the proposed algorithm and undertaken feature parameters have improved the detection of COVID-19 by 5%compared to the existing methods. 展开更多
关键词 COVID-19 gfcc DHO-ANN cough data
暂未订购
基于GFCC和能量算子倒谱的语种识别 被引量:5
5
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率倒谱系数 有声无声段检测 Teager能量算子倒谱参数 主成分分析
在线阅读 下载PDF
基于MFCC和GFCC特征融合的汽车鸣笛声识别方法
6
作者 朱晓丽 李吉祥 +1 位作者 陈明 钱盛友 《电脑与信息技术》 2023年第2期24-26,30,共4页
对鸣笛声的准确识别是机动车鸣笛抓拍系统得以运用的关键。为了克服单一特征对鸣笛声表征不足的缺陷,提高识别的准确性,文章将Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)与Gama频率倒谱系数(Gammatone Frequency Cepstr... 对鸣笛声的准确识别是机动车鸣笛抓拍系统得以运用的关键。为了克服单一特征对鸣笛声表征不足的缺陷,提高识别的准确性,文章将Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)与Gama频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)融合得到M-GFCC特征,并分别使用支持向量机(Support Vector Machines,SVM)和BP(Back Propagation,BP)神经网络算法进行分类。实验结果表明,与使用单一的MFCC特征相比,BP神经网络对鸣笛声识别的有效率提高了10.4%,SVM的有效率提高了4.4%;相较于单一的GFCC特征,BP神经网络的有效率提高了6.6%,SVM的有效率提高了4.2%,证明了该融合特征能提高鸣笛声识别准确性。 展开更多
关键词 鸣笛识别 MFCC gfcc SVM BP神经网络
在线阅读 下载PDF
GFCC与韵律特征参数融合的语音情感识别 被引量:3
7
作者 王华朋 刘恩 +2 位作者 晁亚东 刘元周 倪令格 《中国刑警学院学报》 2020年第2期124-128,共5页
为了有效提高语音情感识别的准确率,结合Mel频率倒谱系数特征准确性高、GFCC特征抗噪性强的特点,提出了一种将GFCC与Mel频率倒谱系数、韵律特征相融合的语音情感识别算法。针对高兴、悲伤、惊恐、中性、生气5种情感语音,分别对单一Mel... 为了有效提高语音情感识别的准确率,结合Mel频率倒谱系数特征准确性高、GFCC特征抗噪性强的特点,提出了一种将GFCC与Mel频率倒谱系数、韵律特征相融合的语音情感识别算法。针对高兴、悲伤、惊恐、中性、生气5种情感语音,分别对单一Mel频率倒谱系数特征算法、单一GFCC特征算法及改进的混合特征算法进行实验比对分析。实验结果表明,加入GFCC的混合特征后,语音情感识别算法的识别准确率及稳定性均有明显的提高,对公安工作具有现实的意义。 展开更多
关键词 gfcc SVM 语音情感特征 情感识别
原文传递
基于双通道特征的含噪声纹识别方法研究
8
作者 伍雄 陈为真 《计算机应用与软件》 北大核心 2025年第7期205-211,共7页
针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱... 针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱系数特征,结合它们的差分谱构成混合特征,融合成双通道声纹特征(DCVF)。实验结果表明:在纯净语音数据集中,双通道声纹特征可达到99.5%的识别率;在含噪语音数据集下,DCVF的识别效果有明显提升。 展开更多
关键词 声纹识别 梅尔频率倒谱系数 伽马通倒谱系数 特征融合 抗噪性
在线阅读 下载PDF
伪装语音GFCC与共振峰混合特征的提取与识别 被引量:1
9
作者 姜囡 《中国刑警学院学报》 2020年第5期122-128,共7页
研究基于混合特征的伪装语音声纹特征提取和识别问题。分析了共振峰及GFCC这两种特征参数的提取方法,针对伪装语音对声纹识别性能的影响,提出从初始语音数据中提取基于共振峰、GFCC及其差分系数的混合特征方法,获得了鲁棒性更强、更具... 研究基于混合特征的伪装语音声纹特征提取和识别问题。分析了共振峰及GFCC这两种特征参数的提取方法,针对伪装语音对声纹识别性能的影响,提出从初始语音数据中提取基于共振峰、GFCC及其差分系数的混合特征方法,获得了鲁棒性更强、更具区分特性的说话人特征。通过和常规的基于GFCC特征的识别方法实验分析比较,所提出的基于混合特征参数的声学系统将发声特性与听觉特性结合,可以更好地体现话者的信息,具有更高的识别准确率。 展开更多
关键词 伪装语音识别 gfcc 共振峰 混合特征
原文传递
基于深度自编码网络语音识别噪声鲁棒性研究 被引量:9
10
作者 黄丽霞 王亚楠 +1 位作者 张雪英 王洪翠 《计算机工程与应用》 CSCD 北大核心 2017年第13期49-54,共6页
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,... 为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。 展开更多
关键词 语音识别 鲁棒性 深度自编码网络 gfcc特征 MFCC特征
在线阅读 下载PDF
基于卷积神经网络的反无人机系统声音识别方法 被引量:14
11
作者 薛珊 李广青 +1 位作者 吕琼莹 毛逸维 《工程科学学报》 EI CSCD 北大核心 2020年第11期1516-1524,共9页
针对如何识别无人机的问题,提出了一种基于卷积神经网络的声音识别无人机的方法.首先,对100 m范围内的无人机、鸟和人的声音进行采集、预处理和提取MFCC+GFCC特征值,将其特征参数作为卷积神经网络学习和识别的数据集;然后分别设计了支... 针对如何识别无人机的问题,提出了一种基于卷积神经网络的声音识别无人机的方法.首先,对100 m范围内的无人机、鸟和人的声音进行采集、预处理和提取MFCC+GFCC特征值,将其特征参数作为卷积神经网络学习和识别的数据集;然后分别设计了支持向量机和卷积神经网络两种模型对无人机等声音进行识别实验.实验结果表明,运用支持向量机识别无人机的准确率为91.9%,卷积神经网络识别无人机的准确率为96.5%.为了进一步验证设计的卷积神经网络的识别能力,在部分UrbanSound8K数据集上进行测试,准确率达到90%.实验结果表明运用卷积神经网络识别无人机具有可行性,且识别性能优于支持向量机. 展开更多
关键词 无人机 声音检测 公共安全 MFCC特征值 gfcc特征值 卷积神经网络
在线阅读 下载PDF
噪声环境下法庭语音证据量化评价方法 被引量:3
12
作者 王华朋 姜囡 +1 位作者 晁亚东 刘恩 《计算机应用与软件》 北大核心 2019年第7期65-68,98,共5页
针对说话人自动识别系统的性能与稳定性在高噪声环境下会严重下降,人耳却能捕捉高噪声环境中的目标语音的问题。提出使用能模拟耳蜗听觉特性的GFCC(Gammatone Frequency Cepstral Coefficient)特征与主成分分析(Principal Component Ana... 针对说话人自动识别系统的性能与稳定性在高噪声环境下会严重下降,人耳却能捕捉高噪声环境中的目标语音的问题。提出使用能模拟耳蜗听觉特性的GFCC(Gammatone Frequency Cepstral Coefficient)特征与主成分分析(Principal Component Analysis,PCA)相结合的方法,以提高识别系统的鲁棒性。在不同程度信噪比的真实语音案件噪声条件下,对国际上最认可的基于似然比证据评估体系的法庭自动说话人识别系统的准确性和稳定性进行测试。实验结果显示:GFCC特征在多个程度的信噪比条件下,甚至信噪比为-20 dB的条件下,依然能保持较高的识别准确度和良好的稳定性,并能够提供可量化、可重复的证据强度值。 展开更多
关键词 gfcc 似然比 证据强度 科学证据 PCA
在线阅读 下载PDF
法庭语音比对中话者自身变化性建模方法研究 被引量:2
13
作者 王华朋 姜囡 +1 位作者 刘恩 晁亚东 《计算机工程与应用》 CSCD 北大核心 2019年第8期110-115,214,共7页
针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人... 针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC(Mel Frequency Cepstral Coefficients)和GFCC(Gammatone Frequency Cepstral Coefficients)特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明:该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。 展开更多
关键词 似然比 证据强度 建模 梅尔频率倒谱系数(MFCC) 伽马通频率倒谱系数(gfcc)
在线阅读 下载PDF
多类型语音特征进化选择算法
14
作者 张小恒 谢文宾 李勇明 《计算机工程与应用》 CSCD 北大核心 2016年第14期150-155,219,共7页
基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式... 基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标(识别率,EER,DET曲线)上都有显著提高。 展开更多
关键词 说话人识别 多类型语音特征 链式智能体遗传算法 伽马通滤波器倒谱系数(gfcc) 梅尔频率倒谱系数(MFCC) 线性预测倒谱系数(LPCC)
在线阅读 下载PDF
噪声环境下多特征融合的语音端点检测方法 被引量:14
15
作者 罗思洋 龙华 +1 位作者 邵玉斌 杜庆治 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期671-680,共10页
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)的投... 针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上. 展开更多
关键词 语音端点检测 子带谱熵 Mel频率倒谱系数(MFCC) Gammatone频率倒谱系数(gfcc) 多特征融合
在线阅读 下载PDF
一种舰载低信噪比环境下的音频端点检测算法 被引量:3
16
作者 王中正 王鉴 +1 位作者 韩焱 韩星程 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第3期197-203,共7页
针对舰载环境下音频端点检测准确率及鲁棒性较低的问题,提出了一种谱减法和朴素贝叶斯分类器相结合的音频端点检测算法。首先提取纯净音频信号MFCC0与GFCC0构建融合特征,与能熵比特征一同作为朴素贝叶斯分类器的输入进行训练及建模,再... 针对舰载环境下音频端点检测准确率及鲁棒性较低的问题,提出了一种谱减法和朴素贝叶斯分类器相结合的音频端点检测算法。首先提取纯净音频信号MFCC0与GFCC0构建融合特征,与能熵比特征一同作为朴素贝叶斯分类器的输入进行训练及建模,再利用多窗谱谱减法提升待测含噪信号信噪比,提取信号相关特征,朴素贝叶斯分类器根据待测信号特征判断该信号的类别。仿真实验结果表明,该算法针对舰载低信噪比含噪音频信号与传统方法相比有效降低了虚检和漏检,具有更好的准确性及鲁棒性。 展开更多
关键词 音频端点检测 多窗谱谱减法 Mel频率倒谱系数(MFCC) Gammatone频率倒谱系数(gfcc) 朴素贝叶斯
在线阅读 下载PDF
一种基于感知特征动态失真度量的语音质量评估算法 被引量:3
17
作者 张来洪 邱波 刘红玉 《自动化技术与应用》 2017年第4期1-4,11,共5页
实现一种基于语音感知特征参数动态规整失真度量的客观侵入式语音质量评估算法,该算法分为特征提取、失真度量、MOS映射三个步骤。算法的创新在于:特征提取过程中选取更能表征语音实质的GFCC参数取代传统的LPC、LPCC、MFCC、IMFCC等参数... 实现一种基于语音感知特征参数动态规整失真度量的客观侵入式语音质量评估算法,该算法分为特征提取、失真度量、MOS映射三个步骤。算法的创新在于:特征提取过程中选取更能表征语音实质的GFCC参数取代传统的LPC、LPCC、MFCC、IMFCC等参数,在失真度量过程中选用动态规整距离取代传统的平均欧式距离,MOS映射时对映射函数进行修正以防止出现坏值而影响算法性能。文章详细介绍了算法的原理,在实现算法的基础上从相关度和偏离误差等指标对算法性能进行衡量,结果证明算法性能良好。 展开更多
关键词 语音质量评估 gfcc 动态规整 MOS映射
在线阅读 下载PDF
结合差分演化和逻辑回归的构音障碍自动识别方法 被引量:1
18
作者 黎雨星 梁正友 孙宇 《计算机与现代化》 2019年第8期1-5,共5页
针对传统的构音障碍诊断方法存在耗时高、成本高等问题,提出一种构音障碍语音的计算机自动识别方法。结合Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficients, GFCC)与常用声学特征形成组合声学特征,应用差分演化算法进... 针对传统的构音障碍诊断方法存在耗时高、成本高等问题,提出一种构音障碍语音的计算机自动识别方法。结合Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficients, GFCC)与常用声学特征形成组合声学特征,应用差分演化算法进行特征选择,并使用逻辑回归分类器对构音障碍语音进行识别。将Torgo构音障碍语音数据库分成3个语音子集,分别是非词、短词语、限制句子集,提取24维GFCC和37维常用的声学特征构成组合声学特征,最后使用差分演化算法和逻辑回归分类器进行分类识别。实验表明:使用差分演化算法可以有效选择出具有更佳识别能力的特征,从而显著提高构音障碍识别率。在非词子集上的实验准确率达到98.18%,召回率为98.3%,精确率为98.3%。 展开更多
关键词 gfcc 差分演化算法 逻辑回归 构音障碍识别
在线阅读 下载PDF
基于CASA的噪声环境下的话者辨认
19
作者 李冬冬 唐建 +1 位作者 李然军 李辉 《小型微型计算机系统》 CSCD 北大核心 2016年第5期1107-1111,共5页
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码... 传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高. 展开更多
关键词 计算听觉场景分析 Gammatone频率倒谱系数(gfcc) 理想二值掩码(IBM) 阈值
在线阅读 下载PDF
Research on Voiceprint Recognition of Camouflage Voice Based on Deep Belief Network 被引量:5
20
作者 Nan Jiang Ting Liu 《International Journal of Automation and computing》 EI CSCD 2021年第6期947-962,共16页
The problem of disguised voice recognition based on deep belief networks is studied. A hybrid feature extraction algorithm based on formants, Gammatone frequency cepstrum coefficients(GFCC) and their different coeffic... The problem of disguised voice recognition based on deep belief networks is studied. A hybrid feature extraction algorithm based on formants, Gammatone frequency cepstrum coefficients(GFCC) and their different coefficients is proposed to extract more discriminative speaker features from the original voice data. Using mixed features as the input of the model, a masquerade voice library is constructed. A masquerade voice recognition model based on a depth belief network is proposed. A dropout strategy is introduced to prevent overfitting, which effectively solves the problems of traditional Gaussian mixture models, such as insufficient modeling ability and low discrimination. Experimental results show that the proposed disguised voice recognition method can better fit the feature distribution, and significantly improve the classification effect and recognition rate. 展开更多
关键词 Disguised voice recognition deep belief network feature extraction Gammatone frequency cepstrum coefficients(gfcc) DROPOUT
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部