基于嵌入式注意机制的目标语音提取算法被引量：2

Target Speech Extraction Algorithm Based on Embedded Attention Mechanism

下载PDF

导出

摘要针对说话人语音提取问题,提出了一种基于深度神经网络多任务学习的嵌入式注意机制单声道说话人语音提取方法;该算法将语音分离和语音提取统一到单个框架中,向频谱映射分离模型中嵌入说话人注意机制,并在引入说话人辅助信息的注意机制中得到时变注意权重,利用时变注意权重分离出目标说话人的内部嵌入向量,随后采用提取模型对目标说话人的嵌入向量进行非线性处理运算,估计出目标说话人对应的掩蔽,进而提取出目标说话人语音;同时借助TIMIT数据集,进行了语音提取实验;实验结果验证了所提算法的可行性和有效性,并在说话人语音提取的性能上有明显的优越性。 Aiming at the problem of speaker speech extraction,a monophonic speaker speech extraction method based on deep neural network multi-task learning embedded attention mechanism is proposed.The algorithm unifies the speech separation and speech extraction into single framework,embeds the speaker attention mechanism in the spectrum mapping separation network,obtains the time-varying attention weight in the attention mechanism of the speaker auxiliary information,utilizes the time-varying attention weight to separate the internal embedded vector of the target speaker,and then adopts the extraction model to perform nonlinear processing operations on the embedded vector of the target speaker,estimates the mask corresponding to the target speaker,and then extracts the target speaker’s voice.At the same time,by means of the TIMIT dataset,the speech extraction experiments are carried out.The experimental results show the feasibility and effectiveness of the proposed algorithm,and it has obvious superiority in the performance of speaker speech extraction.

作者郭志楷杨明堃蒋国峰陶祁刘欢欢马红强 GUO Zhikai;YANG Mingkun;JIANG Guofeng;TAO Qi;LIU Huanhuan;MA Hongqiang(Aircraft Maintenance NCO Academy of Air Force Engineering University,Xinyang 464099,China)

机构地区空军工程大学航空机务士官学校航空电子工程系

出处《计算机测量与控制》 2023年第10期174-181,共8页 Computer Measurement &Control

关键词深度神经网络单声道说话人语音提取多任务学习嵌入式注意机制 deep neural network monophonic speaker speech extraction multi-task learning embedded attention mechanism

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1任晨曦,王黎明,韩星程,叶泽甫,朱竹君.基于联合神经网络的水声目标识别方法[J].舰船科学技术,2022,44(1):136-141. 被引量：13

二级参考文献7

1章业成.水声目标识别技术的现状与发展[J].电子技术与软件工程,2019,0(18):97-98. 被引量：4
2张少康,王超,田德艳,张小川.长短时记忆网络水下目标噪声智能识别方法[J].舰船科学技术,2019,41(23):181-185. 被引量：11
3王培兵,彭圆.深度学习在水声目标识别中的应用研究[J].数字海洋与水下攻防,2020,3(1):11-17. 被引量：5
4张少康,王超,孙芹东.基于多类别特征融合的水声目标噪声识别分类技术[J].西北工业大学学报,2020,38(2):366-376. 被引量：8
5王小宇,李凡,曹琳,李军,张驰,彭圆,丛丰裕.改进的卷积神经网络实现端到端的水下目标自动识别[J].信号处理,2020,36(6):958-965. 被引量：10
6杨路飞,章新华,吴秉坤,李兰瑞.基于MFCC特征的被动水声目标深度学习分类方法[J].舰船科学技术,2020,42(19):129-133. 被引量：9
7王升贵,胡桥,陈迎亮,叶明刚.基于深度学习的水下目标识别方法研究[J].舰船科学技术,2020,42(23):141-145. 被引量：15

共引文献12

1张奇,笪良龙,王超,张延厚,禚江浩.基于深度学习的水声被动目标识别研究综述[J].电子与信息学报,2023,45(11):4190-4202. 被引量：11
2刘聪,韩东,张欣洋,李宁.面向原始辐射噪声的水声目标识别研究[J].电声技术,2023,47(8):30-37. 被引量：1
3潘晓英,冯天浩,孙乃葳,张无瑕,郑为.基于时频联合和加权决策的水声目标识别方法[J].舰船科学技术,2024,46(1):137-142. 被引量：1
4陈鑫,邵杰,王星星,杨鑫,杨世逸林.基于面积加权GWT-GFT的水声目标识别[J].计算机技术与发展,2024,34(7):108-115.
5滕佳篷,武国启,富琦晋.基于WOA-VMD-MSE-SVM的海水泵激励源识别方法[J].舰船科学技术,2024,46(18):44-48. 被引量：1
6李昊鑫,肖长诗,元海文,郭玉滨,刘加轩.特征降维与融合的水声目标识别方法[J].哈尔滨工程大学学报,2025,46(1):102-110. 被引量：4
7刘梦然,连恒绪,聂磊,简泽明.基于特征金字塔融合的水下目标识别方法研究[J].舰船科学技术,2025,47(4):117-123. 被引量：1
8许玮婷,赵英亮,冯思奇,韩星程,贾彩琴.基于3D融合特征联合神经网络的水声目标识别[J].计算机系统应用,2025,34(3):72-84. 被引量：2
9李婷婷,殷莹,张佳蕊.结合MFCC与BiLSTM的AI音频智能拼接模型研究[J].自动化与仪器仪表,2025(4):168-172.
10赵满庆.基于深度学习的水下声目标智能识别方法[J].国外电子测量技术,2025,44(3):44-48.

同被引文献13

1岳训,迟忠先,莫宏伟,郝艳友.基于网络社区模块结构的特征选择性能评价[J].计算机工程,2007,33(12):16-18. 被引量：3
2刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：74
3高洁,彭绍东.学习者认知负荷差异化测量量表开发与验证[J].中国成人教育,2022(10):28-33. 被引量：4
4李琳,赵锐,江晋.基于注意力机制神经网络的数学教学质量预测[J].现代电子技术,2023,46(14):175-179. 被引量：2
5李海林,王杰,周文浩,蔡煜,林伟滨.时间序列复杂网络分析中的可视图方法研究综述[J].电子学报,2023,51(9):2598-2622. 被引量：5
6孙群,詹新武.优化CityGML的室内三维拓扑数据模型[J].南昌工程学院学报,2023,42(6):65-70. 被引量：2
7涂继伟,汪镭,蔡振翔,耿绍晋,李东洋.基于动态ε约束处理机制的双种群约束多目标优化算法[J].南昌工程学院学报,2024,43(1):82-92. 被引量：1
8曹蓉.基于云计算的Hadoop大数据平台挖掘算法研究[J].电子产品世界,2024,31(7):24-27. 被引量：2
9刘春,马小龙,戚远帆,厉彦一,乔亦弘.前融合策略下辅助智能驾驶的多模态数据采集与高精度点云地图构建[J].测绘通报,2024(8):8-12. 被引量：5
10徐竟祎,马好梦,章骏杰,张效邦,应一凡,孙佩源.智慧教育平台体系运行监测研究[J].现代教育技术,2024,34(9):133-141. 被引量：6

引证文献2

1钟元权.智慧教学背景下的教学质量预测——基于多模态与复杂网络的应用[J].南昌工程学院学报,2024,43(6):82-90. 被引量：3
2丁鑫,夏秀渝.基于双路Conformer的目标说话人提取网络[J].电子制作,2025,33(3):32-37.

二级引证文献3

1陈辉,夏露,孙凤杰,钟莲,耿兴隆.智慧教学监测云设计与实现[J].科技传播,2025,17(9):6-10.
2郁莹珺,徐意,何靖霞.智慧教学背景下应用型本科高校教学质量保障体系研究[J].进展,2025(13):19-21.
3陈云柯,杨哲.多模态网络可编程交换机的可配置限速机制分析[J].科技资讯,2025,23(20):24-26.

1李思佳,刘世光.基于视觉画面的空间音频合成及电影行业应用研究[J].现代电影技术,2023(9):4-10. 被引量：7
2余加民,艾青.配电网故障区段定位的粒子群灰狼混合算法[J].现代信息科技,2023,7(17):168-173. 被引量：2

计算机测量与控制

2023年第10期

浏览历史

内容加载中请稍等...

基于嵌入式注意机制的目标语音提取算法被引量：2

参考文献1

二级参考文献7

共引文献12

同被引文献13

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于嵌入式注意机制的目标语音提取算法 被引量：2

参考文献1

二级参考文献7

共引文献12

同被引文献13

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于嵌入式注意机制的目标语音提取算法被引量：2