期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于DC-Wave-U-Net网络的端到端语音增强算法
1
作者 任昱叡 韦峻峰 《数据通信》 2025年第3期21-25,31,共6页
Wave-U-Net模型融合了U-Net架构与WaveNet模型的特点,在语音增强领域获得了广泛应用。然而,在音频信号特征提取的下采样过程中,由于特征感受野有限,并未充分将浅层特征与深层特征有效地结合起来,导致其在瞬态噪声降噪任务中的性能表现... Wave-U-Net模型融合了U-Net架构与WaveNet模型的特点,在语音增强领域获得了广泛应用。然而,在音频信号特征提取的下采样过程中,由于特征感受野有限,并未充分将浅层特征与深层特征有效地结合起来,导致其在瞬态噪声降噪任务中的性能表现有限。空洞卷积则通过在卷积核内部填充间隔的0元素,扩展了卷积操作的视野,使其特征提取的感受野相较于传统卷积更为广阔。鉴于此,提出了一种融合空洞卷积技术的Wave-U-Net语音增强网络DC-Wave-U-Net。在VoiceBank+DEMAND数据集上进行仿真实验,结果表明,与基线模型相比,DC-Wave-U-Net在相同信噪比条件下的PESQ平均提升了0.24;在相同噪声环境下,PESQ平均提升了0.21。 展开更多
关键词 wave-u-net 语音增强 感受野 空洞卷积
在线阅读 下载PDF
面向人工耳蜗的改进Wave-U-Net算法 被引量:1
2
作者 巩瑾琪 叶萍 +3 位作者 吴逸凡 常兆华 樊伟 许长建 《生物医学工程研究》 2024年第1期62-69,共8页
针对人工耳蜗在噪声环境下言语感知效果差,以及现有算法降噪能力不足的问题,本研究提出了一种改进的Wave-U-Net模型。通过采取轻量化卷积,引入注意力机制,改进损失函数,优化数据集结构,以提高人工耳蜗的降噪效果。使用短时客观可懂度(sh... 针对人工耳蜗在噪声环境下言语感知效果差,以及现有算法降噪能力不足的问题,本研究提出了一种改进的Wave-U-Net模型。通过采取轻量化卷积,引入注意力机制,改进损失函数,优化数据集结构,以提高人工耳蜗的降噪效果。使用短时客观可懂度(short-time objective intelligibility,STOI)、语音质量评估(perceptual evaluation of speech quality,PESQ)、浮点运算次数(floating point operations per second,FLOPs)和参数量(Params)对模型的降噪效果和复杂度进行了评估,分别达到0.81、2.75,0.83 G,1.04 M。实验结果表明,本研究算法在符合人工耳蜗产品规范的基础上,实现了明显的降噪效果,提高了人工耳蜗使用者在复杂噪声环境中的语音感知效果。本研究方法为人工耳蜗算法的改进提供了新的可能,可为听力受损患者提供更好的听觉感受。 展开更多
关键词 人工耳蜗 改进wave-u-net 噪声环境 语音感知 语音降噪
暂未订购
低信噪比下基于融合网络的音素识别方法
3
作者 黄辉波 邵玉斌 +1 位作者 龙华 杜庆治 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第4期786-796,共11页
针对低信噪比下音素识别准确率低的问题,提出一种新的识别方法。提取语音的Fbank特征,输入到由多头注意力机制、ResNet、BLSTM、CTC构建的A-R-B-CTC模型中进行音素识别,利用Wave-U-Net对语音特征Fbank、MFCC、GFCC、对数频谱进行图像去... 针对低信噪比下音素识别准确率低的问题,提出一种新的识别方法。提取语音的Fbank特征,输入到由多头注意力机制、ResNet、BLSTM、CTC构建的A-R-B-CTC模型中进行音素识别,利用Wave-U-Net对语音特征Fbank、MFCC、GFCC、对数频谱进行图像去噪,发现Fbank特征去噪后,可以取得更低的音素错误率。在0 dB白噪声环境下采用THCHS30数据集进行实验验证。结果表明,Fbank去噪前,所提A-R-B-CTC模型相比于BLSTM-CTC、ResNet-BLSTM-CTC、Transformer模型,平均音素错误率分别降低了4.38%、2.5%、1.96%;Fbank去噪后,4种模型的音素错误率明显下降,其中所提A-R-B-CTC模型相比于其他3种模型性能依旧出色。此外,在其他信噪比下也达到了不错的效果。 展开更多
关键词 音素识别 wave-u-net 端到端 多头自注意力机制 Transformer模型
在线阅读 下载PDF
基于U-net网络的频散曲线自动拾取方法研究 被引量:2
4
作者 卜凯旭 姚振岸 +4 位作者 任望 李红星 王向腾 毕升博 陈振昊 《工程地球物理学报》 2024年第4期734-741,共8页
频散曲线拾取是面波勘探的关键环节,旨在通过频散曲线反演出地下横波速度结构。然而目前频散曲线拾取工作主要依靠人工拾取,耗时耗力。为此,本文通过将频散曲线拾取问题看成是图像分割问题,引入U-net网络,发展出一种频散曲线的自动拾取... 频散曲线拾取是面波勘探的关键环节,旨在通过频散曲线反演出地下横波速度结构。然而目前频散曲线拾取工作主要依靠人工拾取,耗时耗力。为此,本文通过将频散曲线拾取问题看成是图像分割问题,引入U-net网络,发展出一种频散曲线的自动拾取方法。该方法使用频散能量图并使其作为数据集,使用人工手动拾取的频散曲线作为标签集;通过卷积神经网络经由上采样、下采样和跳层链接等步骤学习图片特征,实现频散曲线的自动拾取。模型测试结果验证了利用U-net网络提取频散曲线的准确性。最后本文将训练好的网络模型应用于冰岛南部Ölfusá河岸的Arnarbæli周边试验场地的实际数据频散曲线提取,并将提取结果与手动拾取的频散曲线进行对比。结果表明,利用U-net网络提取频散曲线预测速度快,预测512×512×3大小的图片耗时为96 ms,预测准确度高。 展开更多
关键词 瑞雷波勘探 频散曲线拾取 深度学习 卷积神经网络 U-net网络 人工智能
在线阅读 下载PDF
基于改进U-Net模型的地震波初至到时拾取分析
5
作者 司文学 李超 《微型电脑应用》 2024年第7期1-4,共4页
为了提高地震波的拾取精度,在分析U-Net工作机制的基础上设计一种优化后的U-Net模型。该模型由桥接、编码、解码共同构成。用卷积神经网络进行分类,利用池化操作提取低层次特征参数,由于选择池化操作模式时会引起拾取精度的明显降低,故... 为了提高地震波的拾取精度,在分析U-Net工作机制的基础上设计一种优化后的U-Net模型。该模型由桥接、编码、解码共同构成。用卷积神经网络进行分类,利用池化操作提取低层次特征参数,由于选择池化操作模式时会引起拾取精度的明显降低,故选步长为4的卷积方式。根据评价指标判断STA/LTA、U-Net与改进U-Net 3种方法的处理性能。研究结果表明:利用Tensorflow与Keras对网络实施训练,改进U-Net模型达到了99%的精度。epcho由10提高至50,P波参数识别准确率从72%提高至94%,S波识别准确率从63%提高至94%。最初损失为10.25,经过训练后100个epcho减小至0.15。改进U-Net相对传统地震信号处理方法达到了更优的查准率、查全率与F_(1)分值指标,采用卷积神经网络进行处理时则可以利用卷积操作提取地震波形特征产数,具备更强的适应性。 展开更多
关键词 地震波 U-Net模型 神经网络 拾取精度
在线阅读 下载PDF
基于位移窗口自注意力网络和迁移学习的地震面波分离
6
作者 杨晨睿 沈鸿雁 +2 位作者 车晗 孙云鹏 刘帅 《西安石油大学学报(自然科学版)》 CAS 北大核心 2024年第6期39-50,共12页
反射地震资料中的面波也携带了丰富的地质信息,充分利用这类面波解决地质问题的前提条件是将其完整地分离出来。针对现有深度学习方法没有充分利用面波与体波表现在时空域图像中的分布位置和纹理细节等问题,提出一种基于深度学习的地震... 反射地震资料中的面波也携带了丰富的地质信息,充分利用这类面波解决地质问题的前提条件是将其完整地分离出来。针对现有深度学习方法没有充分利用面波与体波表现在时空域图像中的分布位置和纹理细节等问题,提出一种基于深度学习的地震面波分离方法。通过融合位移窗口自注意力机制和U-net主干网络,构建出面波智能分离网络,并使用数据增广后的模拟数据与实际数据构建面波数据集来提升神经网络的泛化性;在充分利用面波全局数据特征的同时,为避免波场分离过程中的面波损伤问题,提出一种对边界、结构和纹理信息敏感的混合损失函数以进一步提高面波分离的质量。通过数值模拟地震记录测试了本文方法的正确性,进而将该方法应用于实际地震资料处理。研究结果表明,在模拟地震记录训练的模型基础上进行迁移学习,可进一步提升神经网络的泛化性;相较于低通滤波法和去噪卷积神经网络方法,本文方法分离的面波更为完整,能大幅度提高能量混叠区域的面波分离质量。 展开更多
关键词 地震信号处理 面波 波场分离与去噪 深度学习 窗口自注意力网络 U-net网络 迁移学习
在线阅读 下载PDF
基于残差注意力U-Net结构的端到端歌声分离模型 被引量:8
7
作者 汪斌 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期619-626,共8页
歌声分离是音乐信息检索领域最具挑战的任务之一,本文对基于Wave-U-Net的歌声分离模型进行了改进以增强其性能。首先,在Wave-U-Net的编码和解码块中设计并引入了残差单元以增强其特征提取的有效性和训练效率;然后,在Wave-U-Net的跳跃连... 歌声分离是音乐信息检索领域最具挑战的任务之一,本文对基于Wave-U-Net的歌声分离模型进行了改进以增强其性能。首先,在Wave-U-Net的编码和解码块中设计并引入了残差单元以增强其特征提取的有效性和训练效率;然后,在Wave-U-Net的跳跃连接部分设计并引入了注意力门控机制以减少从编码块对应层提取的特征和来自解码块上一层特征之间的语义鸿沟。在MUSDB18数据集上的实验结果表明:本文提出的RA-WaveUNet模型在分离性能上优于传统的Wave-U-Net模型;采用残差单元和注意力门控机制均有助于提高模型的性能。 展开更多
关键词 残差单元 注意力门控 wave-u-net RA-WaveUNet 歌声分离(SVS)
在线阅读 下载PDF
改进的毫米波复数网络稀疏成像算法 被引量:1
8
作者 车俐 吴兴云 +2 位作者 汪林 杜刚 蒋留兵 《计算机应用研究》 CSCD 北大核心 2022年第2期604-608,共5页
针对基于压缩感知的重构方法耗时巨大的问题,从信号恢复的角度提出了一种基于深度学习方法的稀疏成像方案。首先,构建基于复数卷积的U-Net网络。其次,将欠采样信号输入网络得到满采样信号。最后,使用距离维脉压的二维匹配滤波算法重构... 针对基于压缩感知的重构方法耗时巨大的问题,从信号恢复的角度提出了一种基于深度学习方法的稀疏成像方案。首先,构建基于复数卷积的U-Net网络。其次,将欠采样信号输入网络得到满采样信号。最后,使用距离维脉压的二维匹配滤波算法重构出目标。实验建立在不同稀疏度和不同采样间隔下的欠采样仿真数据集中,并与传统和最近的信号处理方法进行对比。再使用实测数据进行验证,实验结果表明该算法在重构耗时以及图像平均梯度上具有更好的表现。 展开更多
关键词 毫米波 稀疏阵列 二维匹配滤波 复数卷积U-Net网络
在线阅读 下载PDF
基于U-net卷积神经网络图像分割的波浪测量方法 被引量:2
9
作者 任志伟 陈松贵 +1 位作者 王收军 王佳伟 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第9期125-132,共8页
针对水体运动导致电子传感装置测量结果准确性下降的问题和阈值分割法无法在光照场景下测量波面的问题,文章提出了一种基于U-net卷积神经网络的波浪测量方法。实验过程首先由高清摄像机录制水槽中的波浪运动过程,将视频处理成时间连续... 针对水体运动导致电子传感装置测量结果准确性下降的问题和阈值分割法无法在光照场景下测量波面的问题,文章提出了一种基于U-net卷积神经网络的波浪测量方法。实验过程首先由高清摄像机录制水槽中的波浪运动过程,将视频处理成时间连续的波面图像,其次通过U-net卷积神经网络对波面图像进行图像分割并提取水位线数据信息,最后求出波高和周期。以像素识别结果为基准,将本研究方法的测量结果与波高传感器的测量结果进行误差对比,结果表明U-net卷积神经网络的相对误差最大为2.25%,而传感器误差最大为4.15%,且实验组中U-net卷积神经网络测得平均波高的相对误差均在2.5%以内,平均周期的误差都低于1%。因此,基于U-net卷积神经网络的测量方法可用于实验室的波浪测量。 展开更多
关键词 U-net卷积神经网络 阈值分割 图像分割 波高 周期
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部