期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
多尺度注意力聚合视觉Mamba-UNet的遥感图像显著性目标检测方法
1
作者 张善文 郭能念 +2 位作者 邵彧 李萍 许新华 《电光与控制》 北大核心 2026年第2期1-6,13,共7页
针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS... 针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS)模块构建,利用VSS和CASC有效获取遥感图像(RSI)中的长距离依赖关系,在瓶颈层引入空洞多尺度注意力聚合(DMSAA)模块,有效整合局部-全局特征,提取多尺度小目标的细节特征。该模型整合了多尺度卷积、注意力机制、U-Net与Mamba-UNet的优势,提高了RSISOD的性能。在大规模RSI数据集EORSSD中的飞机图像子集上进行了实验。结果表明,MSAAVMamba-UNet能够精确检测RSI中的显著性多尺度小目标,精度达到84.07%,该方法为RSISOD系统提供了技术支持。 展开更多
关键词 遥感图像 显著性目标检测 空洞多尺度注意力聚合 mamba-unet 多尺度注意力聚合视觉mamba-unet
在线阅读 下载PDF
基于Mamba-UNet架构的音高估计模型
2
作者 彭祖剑 《电声技术》 2024年第9期50-52,56,共4页
单声源声音的音高估计算法主要有音高跟踪的鲁棒算法(Robust Algorithm for Pitch Tracking,RAPT)、SWIPE(Sawtooth Waveform Inspired Pitch Estimator)、Harvest等,但在引入有音乐伴奏等复调音乐的声源时,这些算法在人声音高估计任务... 单声源声音的音高估计算法主要有音高跟踪的鲁棒算法(Robust Algorithm for Pitch Tracking,RAPT)、SWIPE(Sawtooth Waveform Inspired Pitch Estimator)、Harvest等,但在引入有音乐伴奏等复调音乐的声源时,这些算法在人声音高估计任务中存在明显不足。借鉴现有的研究成果,改进传统声调估计的鲁棒模型(Robust Model for Vocal Pitch Estimation,RMVPE),提出一种基于Mamba-UNet架构的Mamba-RMVPE,用于解决复调音乐等多声源声音的人声音高估计问题。相较于传统的RMVPE,Mamba-RMVPE的音高准确率(Raw Pitch Accuracy,RPA)、音色准确率(Raw Chroma Accuracy,RCA)、总体正确率(Overall Accuracy,OA)均有提升,推理时间也大幅缩短。 展开更多
关键词 复调音乐 音高估计 声调估计的鲁棒模型(RMVPE) mamba-unet
在线阅读 下载PDF
基于深度学习的头颈部肿瘤放疗患者颈部骨骼肌分割方法研究
3
作者 明智 刘可 +2 位作者 曾斌 吴哲 刘慕俊 《医疗卫生装备》 2025年第8期11-17,共7页
目的:为了自动分割第三颈椎(C3)层面的骨骼肌,提出一种基于轻量级深度学习网络的分割方法。方法:首先,选取2019年1月至2022年12月在自贡市第一人民医院肿瘤科收治的头颈部肿瘤患者121例,并按7∶1∶2随机划分为训练集、验证集和测试集。... 目的:为了自动分割第三颈椎(C3)层面的骨骼肌,提出一种基于轻量级深度学习网络的分割方法。方法:首先,选取2019年1月至2022年12月在自贡市第一人民医院肿瘤科收治的头颈部肿瘤患者121例,并按7∶1∶2随机划分为训练集、验证集和测试集。其次,在UNet网络中引入轻量级Mamba架构,并在跳跃连接路径中添加注意力机制(attention gate,AG),构建MB-UNet网络模型。最后,将训练好的网络模型在测试集上进行分割性能评价,并比较手动分割骨骼肌面积(skeletal muscle area,SMA)与MB-UNet网络模型预测SMA的一致性以及MB-UNet网络模型与经典网络模型UNet、Deeplab V3+、U2Net、VMUNet、UltraLight-VMUNet的参数量和计算量,并统计MBUNet网络模型对SMA的预测时间和医生在MB-UNet网络模型分割基础上修改的时间。结果:构建的MB-UNet网络模型分割C3层面的骨骼肌的戴斯相似性系数为88.23%、交并比为78.94%、敏感度为91.27%、95%豪斯多夫距离为7.13 mm,均优于经典网络模型;手动分割与MB-UNet网络预测的SMA基本接近;MB-UNet网络模型的计算量为1.88 GFLOPS、参数量为0.77M,与其他经典网络模型相比,总体较优;MB-UNet网络模型在测试集上的预测时间为1.93 s,且医生在MB-UNet网络模型分割的基础上修改只需要2 min即可达到满意的结果,相比医生纯手动分割(20 min)大大减少。结论:提出的方法能够精准、快速分割C3层面的骨骼肌并准确计算SMA,有助于临床医师快速诊断头颈部肿瘤患者的肌少症,提高诊断效率。 展开更多
关键词 深度学习 头颈部肿瘤 骨骼肌 智能分割 UNet Mamba架构 注意力机制
在线阅读 下载PDF
基于多尺度聚合与Mamba-Like线性注意力机制的医学影像分割方法研究
4
作者 吴能光 林志刚 +2 位作者 陈拓 庄菲菲 陈虹 《中国医疗设备》 2025年第10期51-57,共7页
目的解决医学影像分割时普遍面临复杂化、组织边界模糊、器官对比度低等问题,尤其是随着Transformer自注意力机制在医学影像分割中被广泛应用,其存在分割效果不佳的缺点。方法将多尺度注意力聚合和Mamba-Like线性注意力机制进行融合,构... 目的解决医学影像分割时普遍面临复杂化、组织边界模糊、器官对比度低等问题,尤其是随着Transformer自注意力机制在医学影像分割中被广泛应用,其存在分割效果不佳的缺点。方法将多尺度注意力聚合和Mamba-Like线性注意力机制进行融合,构建U型网络MM-UNet。其中,引入Mamba-Like线性注意力机制,增强模型对全局依赖的学习能力;同时采用多尺度注意力聚合机制,通过多尺度卷积有针对性地捕获和利用关键特征,更加全面地捕获多尺度语义信息,以提升模型对影像边缘分割的准确性。结果MM-UNet、UNet、VM-UNet、LightM-UNet等算法在皮肤镜ISIC18、ISIC17、超声甲状腺结节TN3K共3个数据集上进行对比实验,结果表明,MM-UNet在皮肤镜ISIC18、ISIC17、超声甲状腺TN3K数据集上的mIoU分别为83.22%、83.63%、80.19%,Dice系数分别为90.84%、91.08%、89.00%,准确度分别为95.86%、96.57%、97.38%,特异性分别为97.95%、98.36%、98.70%。其中,与UNet、VM-UNet、LightM-UNet等模型相比,MM-UNet的mIoU、Dice系数和准确度均表现最优;MM-UNet的特异性在ISIC18、TN3K数据集上表现最优。结论MM-UNet在多种不同成像背景医学影像数据上均实现了较高的分割精度,其泛化性也较好,具有一定的应用价值。 展开更多
关键词 MM-UNet 卷积神经网络 Mamba-Like线性注意力机制 多尺度注意力聚合 Transformer自注意力机制 医学影像分割
暂未订购
上一页 1 下一页 到第
使用帮助 返回顶部