期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于局部Attention和CTC融合的语音情感识别方法研究 被引量:3
1
作者 孟令源 孙哲 +2 位作者 刘扬 赵振 李永伟 《计算机应用与软件》 北大核心 2024年第10期197-201,共5页
针对基于时间序列的语音情感识别方法难以计算情感帧携带的情感信息量的问题,提出一种局部注意力机制(LAM)和结合连接主义时间分类(CTC)融合的语音情感识别模型(LAM-CTC)。提取VGFCC情感特征作为共享编码器的输入;CTC层最小化代价损失... 针对基于时间序列的语音情感识别方法难以计算情感帧携带的情感信息量的问题,提出一种局部注意力机制(LAM)和结合连接主义时间分类(CTC)融合的语音情感识别模型(LAM-CTC)。提取VGFCC情感特征作为共享编码器的输入;CTC层最小化代价损失并预测情感类别,LAM层使用局部注意力机制计算上下文向量;通过解码器对上下文向量进行解码;通过平均值法将解码结果融合得到情感预测结果。实验结果表明,提出的模型在IEMOCAP数据集上的UAR和WAR分别达到了68.1%和68.3%。 展开更多
关键词 语音情感识别 注意力机制 CTC vgfcc IEMOCAP
在线阅读 下载PDF
VMD改进GFCC的情感语音特征提取 被引量:3
2
作者 刘雨柔 张雪英 +2 位作者 陈桂军 黄丽霞 张静 《计算机工程与设计》 北大核心 2020年第8期2265-2270,共6页
传统特征提取忽略了语音信号的非稳态特性,变分模态分解技术可以精细刻画语音的非平稳性,因此利用该技术将情感语音信号分解为K个固有模态函数,对每个分量做快速傅里叶变换后进行频率合成,通过Gammatone滤波器取能量对数,经离散余弦变... 传统特征提取忽略了语音信号的非稳态特性,变分模态分解技术可以精细刻画语音的非平稳性,因此利用该技术将情感语音信号分解为K个固有模态函数,对每个分量做快速傅里叶变换后进行频率合成,通过Gammatone滤波器取能量对数,经离散余弦变换得到新特征变,即分模态分解改进Gammatone频率倒谱系数。通过支持向量机进行语音情感识别,实验结果表明,TYUT2.0中的识别率为72.15%,柏林情感语音库中的识别率为91.10%,识别效果优于传统情感语音特征,验证了该特征的有效性。 展开更多
关键词 特征提取 变分模态分解 变分模态分解改进Gammatone频率倒谱系数 语音情感识别 情感语音特征
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部