期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合CAM++与轻量化Transformer的声纹识别方法
1
作者 赵洪祥 杨乘 《电脑与电信》 2025年第7期5-9,共5页
目前,传统声纹识别方法多依赖卷积神经网络(CNN)提取语音的局部时频特征,难以有效建模长时序依赖和全频域信息,限制了复杂语音条件下的判别性能。为此,提出一种基于上下文感知掩码网络(Context-Aware Masking Network,CAM++)与轻量化Tra... 目前,传统声纹识别方法多依赖卷积神经网络(CNN)提取语音的局部时频特征,难以有效建模长时序依赖和全频域信息,限制了复杂语音条件下的判别性能。为此,提出一种基于上下文感知掩码网络(Context-Aware Masking Network,CAM++)与轻量化Transformer编码块(Lightweight Transformer Encoder Block, LTEB)相结合的声纹识别方法。该方法在CAM++网络的FCM与D-TDNN模块之间引入LTEB模块,LTEB利用Nystr?m近似注意力机制建模长达10秒的全局语音依赖,提升模型的时序感知能力;CAM++网络中的D-TDNN模块则专注于局部语义特征提取,二者协同融合,实现局部感知与上下文建模的统一,从而提升声纹判别能力与模型计算效率。模型以融合的MFCC与FBANK特征为输入进行训练。在CN-Celeb数据集上,所提LTEB-CAM++模型的等错误率(EER)与最小检测代价函数(minDCF)相较基线CAM++分别降低了7.39%和11.17%。 展开更多
关键词 CAM++ 声纹识别 Nystr?m近似注意力 全局-局部特征融合 轻量化编码块
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部