检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于数据增广的声学场景分类被引量：2: 1; 作者李源马成男 +2 位作者李关防王强张文武《指挥控制与仿真》 2021年第1期60-64,共5页; 声学场景分类是计算机听觉领域的热点方向之一,相比计算机视觉,特定场景下音频数据的收集和标注成本相对较高,如何利用有限的声学场景音频获得较高的分类准确率成为当前研究的重点内容。利用深度学习技术,结合轻量化网络模型mobilenetv... 展开更多; 关键词声学场景分类数据增广 specaugment Mixup Cutmix; 在线阅读下载PDF 职称材料

基于多尺度卷积和多头自注意力的语音情感识别模型被引量：3: 2; 作者钟善机张学习 +2 位作者陈楚嘉高学秋陶杰《自动化与信息工程》 2024年第4期36-41,49,共7页; 针对传统的卷积神经网络在语音情感识别中无法充分捕捉时域和频域细节信息的问题,提出一种基于多尺度卷积和多头自注意力(MCNN-MHA)的语音情感识别模型。首先,通过多尺度卷积神经网络在不同尺度下对输入进行卷积操作,获得不同时域和频... 展开更多; 关键词语音情感识别多尺度卷积神经网络多头自注意力机制 specaugment; 在线阅读下载PDF 职称材料

基于数据增强的藏语拉萨方言语音识别研究: 3; 作者巴果高定国尼琼《电脑知识与技术》 2024年第35期1-5,共5页; 藏语属于低资源语言,其语音识别模型的训练面临数据稀缺的挑战。为了解决这一问题,文章研究了数据增强技术在藏语拉萨方言语音识别中的应用。首先,文章比较了DeepSpeech2、Conformer和Squeezeformer等3种主流语音识别模型在藏语拉萨方... 展开更多; 关键词藏语拉萨方言语音识别数据增强端到端模型 specaugment; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部