期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于DMFCC与自注意力的声学场景分类识别
1
作者 李建平 李同康 +2 位作者 杨佳贺 杜星彤 孙美琪 《微型电脑应用》 2025年第12期32-35,共4页
针对声学场景分类准确率低的问题,提出一种基于动态梅尔频率倒谱系数(DMFCC)与自注意力机制的声学场景分类方法。DMFCC能够很好地兼顾声学特征的动态信息和静态信息,自注意力机制的引入可以更好地捕捉语境信息和提高特征的表达能力。与... 针对声学场景分类准确率低的问题,提出一种基于动态梅尔频率倒谱系数(DMFCC)与自注意力机制的声学场景分类方法。DMFCC能够很好地兼顾声学特征的动态信息和静态信息,自注意力机制的引入可以更好地捕捉语境信息和提高特征的表达能力。与其他常用方法进行比较实验,结果表明,基于DMFCC与自注意力机制的联合优化较之前提高了22%的准确率,证明了其有效性。 展开更多
关键词 声学场景分类 动态梅尔频率倒谱系数 自注意力 分类识别
在线阅读 下载PDF
电话信道下应用DMFCC进行说话人识别 被引量:4
2
作者 王刚 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第10期1597-1600,共4页
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有... 鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。 展开更多
关键词 电话信道 说话人识别 鉴别性Mel频率倒谱系数(dmfcc) 融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部