期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DMFCC与自注意力的声学场景分类识别
1
作者
李建平
李同康
+2 位作者
杨佳贺
杜星彤
孙美琪
《微型电脑应用》
2025年第12期32-35,共4页
针对声学场景分类准确率低的问题,提出一种基于动态梅尔频率倒谱系数(DMFCC)与自注意力机制的声学场景分类方法。DMFCC能够很好地兼顾声学特征的动态信息和静态信息,自注意力机制的引入可以更好地捕捉语境信息和提高特征的表达能力。与...
针对声学场景分类准确率低的问题,提出一种基于动态梅尔频率倒谱系数(DMFCC)与自注意力机制的声学场景分类方法。DMFCC能够很好地兼顾声学特征的动态信息和静态信息,自注意力机制的引入可以更好地捕捉语境信息和提高特征的表达能力。与其他常用方法进行比较实验,结果表明,基于DMFCC与自注意力机制的联合优化较之前提高了22%的准确率,证明了其有效性。
展开更多
关键词
声学场景分类
动态梅尔频率倒谱系数
自注意力
分类识别
在线阅读
下载PDF
职称材料
电话信道下应用DMFCC进行说话人识别
被引量:
4
2
作者
王刚
郑方
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009年第10期1597-1600,共4页
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有...
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。
展开更多
关键词
电话信道
说话人识别
鉴别性Mel频率倒谱系数(
dmfcc
)
融合
原文传递
题名
基于DMFCC与自注意力的声学场景分类识别
1
作者
李建平
李同康
杨佳贺
杜星彤
孙美琪
机构
东北石油大学
东北石油大学
出处
《微型电脑应用》
2025年第12期32-35,共4页
基金
海南省重点研发项目(ZDYF2023GXJS004)。
文摘
针对声学场景分类准确率低的问题,提出一种基于动态梅尔频率倒谱系数(DMFCC)与自注意力机制的声学场景分类方法。DMFCC能够很好地兼顾声学特征的动态信息和静态信息,自注意力机制的引入可以更好地捕捉语境信息和提高特征的表达能力。与其他常用方法进行比较实验,结果表明,基于DMFCC与自注意力机制的联合优化较之前提高了22%的准确率,证明了其有效性。
关键词
声学场景分类
动态梅尔频率倒谱系数
自注意力
分类识别
Keywords
acoustic scene classification
dmfcc
self-attention
classification and recognition
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
电话信道下应用DMFCC进行说话人识别
被引量:
4
2
作者
王刚
郑方
机构
清华信息科学与技术国家实验室技术创新与开发部
清华大学计算机科学与技术系
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009年第10期1597-1600,共4页
文摘
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。
关键词
电话信道
说话人识别
鉴别性Mel频率倒谱系数(
dmfcc
)
融合
Keywords
telephone channels
speaker recognition
discriminative Mel frequency cepstrum coefficient (
dmfcc
)
fusion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于DMFCC与自注意力的声学场景分类识别
李建平
李同康
杨佳贺
杜星彤
孙美琪
《微型电脑应用》
2025
0
在线阅读
下载PDF
职称材料
2
电话信道下应用DMFCC进行说话人识别
王刚
郑方
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部