期刊文献+
共找到177篇文章
< 1 2 9 >
每页显示 20 50 100
多尺度注意力聚合视觉Mamba-UNet的遥感图像显著性目标检测方法
1
作者 张善文 郭能念 +2 位作者 邵彧 李萍 许新华 《电光与控制》 北大核心 2026年第2期1-6,13,共7页
针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS... 针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS)模块构建,利用VSS和CASC有效获取遥感图像(RSI)中的长距离依赖关系,在瓶颈层引入空洞多尺度注意力聚合(DMSAA)模块,有效整合局部-全局特征,提取多尺度小目标的细节特征。该模型整合了多尺度卷积、注意力机制、U-Net与Mamba-UNet的优势,提高了RSISOD的性能。在大规模RSI数据集EORSSD中的飞机图像子集上进行了实验。结果表明,MSAAVMamba-UNet能够精确检测RSI中的显著性多尺度小目标,精度达到84.07%,该方法为RSISOD系统提供了技术支持。 展开更多
关键词 遥感图像 显著性目标检测 空洞多尺度注意力聚合 mamba-UNet 多尺度注意力聚合视觉mamba-UNet
在线阅读 下载PDF
基于改进U-Mamba网络的聚酯纤维超微结构分割算法
2
作者 周宇 隗兵 +2 位作者 郝矿荣 皋磊 王华平 《纺织学报》 北大核心 2026年第1期72-79,共8页
针对工业生产中聚酯纤维超微结构中的团聚效应对产品的颜色均匀性、机械性能均匀性及光泽度等性能的负面影响这一问题,提出一种基于改进U-Mamba的聚酯纤维超微结构分割算法。首先利用扫描电子显微镜采集聚酯纤维超微结构中团聚粒子分布... 针对工业生产中聚酯纤维超微结构中的团聚效应对产品的颜色均匀性、机械性能均匀性及光泽度等性能的负面影响这一问题,提出一种基于改进U-Mamba的聚酯纤维超微结构分割算法。首先利用扫描电子显微镜采集聚酯纤维超微结构中团聚粒子分布的高分辨率图像并建立对应的超微结构数据集以评估模型性能,使用结合边缘检测算法的预训练神经网络对纤维图像进行去噪、滤波以及自动着色处理,通过设计高阶视觉状态空间模块和多尺度信息融合模块,改进后的U-Mamba深度网络模型能够准确识别并分割超微结构中团聚体。实验结果表明:在超微结构数据集下,该算法对比其它经典算法具有较高的分割准确性,其交并比达到78.9%,平均准确率达到96.1%,能够满足工业生产中机器视觉技术在高功能纤维超微结构分析中的应用需求。 展开更多
关键词 聚酯纤维 超微结构分布 机器视觉 U-mamba算法 语义分割
在线阅读 下载PDF
基于Mamba与注意力机制的三阴性乳腺癌超声图像分类方法
3
作者 杨颖 宋元冰 +3 位作者 张一峰 吴蓉 杜宇 郑祎 《海军军医大学学报》 北大核心 2026年第1期37-45,共9页
目的探讨一种基于Mamba与注意力机制的混合神经网络架构(MECSA-Net)在三阴性乳腺癌(TNBC)超声图像分类中的应用效果。方法回顾性收集1059幅乳腺超声图像,其中TNBC图像166幅,非TNBC图像893幅。采用图像增强技术缓解类别不平衡问题。提出... 目的探讨一种基于Mamba与注意力机制的混合神经网络架构(MECSA-Net)在三阴性乳腺癌(TNBC)超声图像分类中的应用效果。方法回顾性收集1059幅乳腺超声图像,其中TNBC图像166幅,非TNBC图像893幅。采用图像增强技术缓解类别不平衡问题。提出轻量级混合神经网络架构MECSA-Net,其特征提取模块为高效混洗感知块(SAEffBlock),由状态空间建模分支(SSM-Branch)与轻量卷积分支(EffConvBranch)组成。在分类器前端引入多尺度空洞融合注意力(MDFA)模块,以提升模型对多尺度结构的感知能力和上下文信息建模能力。结果在TNBC分类任务中,MECSA-Net准确率为93.9%、精确率为94.4%、F1分数为93.9%、AUC为0.976,整体性能优于ResNet-18、ResNet-50、EfficientNet-B0、ViT-Base和MedMamba-T等主流模型。混淆矩阵分析显示,该模型对TNBC与非TNBC样本均具备较高的识别准确性和较低的误判率。消融实验进一步验证了EffConvBranch与MDFA模块在局部纹理建模与多尺度结构判别中的关键作用,显著增强了模型的分类性能与鲁棒性。结论MECSA-Net在TNBC超声图像分类中表现出优异的准确性与鲁棒性,具备良好的临床应用前景,可为TNBC术前智能辅助诊断提供技术支持。 展开更多
关键词 三阴性乳腺癌 超声图像 深度学习 mamba 状态空间建模 注意力机制
原文传递
ScaleMamba-YOLO:基于MambaYOLO的多尺度医学目标检测模型
4
作者 覃晓 钱泉梅 《南宁师范大学学报(自然科学版)》 2026年第2期63-75,共13页
针对MambaYOLO在医学影像分析中存在的多尺度适应性不足(病灶尺寸差异大导致固定感受野效果受限)和背景干扰敏感(正常组织噪声影响检测)2个关键问题,本研究提出了一种基于MambaYOLO的多尺度医学目标检测模型ScaleMamba-YOLO。首先,针对... 针对MambaYOLO在医学影像分析中存在的多尺度适应性不足(病灶尺寸差异大导致固定感受野效果受限)和背景干扰敏感(正常组织噪声影响检测)2个关键问题,本研究提出了一种基于MambaYOLO的多尺度医学目标检测模型ScaleMamba-YOLO。首先,针对尺度特征捕捉不足的问题,设计了医学多尺度局部特征增强模块(Medical Multi-scale Local Feature Enhancement Block),通过异构卷积核并行架构实现病理特征的全尺度覆盖,实现了对微小病灶和弥散性大病灶的协同检测。其次,为了减少背景噪声放大,提出特征聚合提取模块(Partial-enhanced C2F),采用部分卷积技术选择性保留关键特征通道,有效抑制了医学影像中正常组织区域的背景干扰。最后,为了验证模型的有效性,在Br35H(脑部MRI肿瘤)和PLoPy(结肠镜息肉)两个典型的公开医学数据集上进行了测试。实验结果表明,ScaleMamba-YOLO模型的平均精度均值(AP)分别达到72.7%和85.7%,相较于基线MambaYOLO模型,AP分别提升了2.2个百分点和1.7个百分点。这表明ScaleMamba-YOLO模型能有效克服多尺度适应性不足和背景干扰问题,可以显著提升模型对不同尺寸医学病灶的检测精度。 展开更多
关键词 mamba mambaYOLO 多尺度特征融合 局部特征增强 医学影像分析
在线阅读 下载PDF
基于多尺度可扩张卷积和DMWT-Mamba的小样本机械故障诊断
5
作者 杨静亚 闫丽梅 +1 位作者 徐建军 曾伟铭 《噪声与振动控制》 北大核心 2026年第1期142-148,246,共8页
研究机械故障智能诊断技术可以保障设备安全稳定运行。在工业生产中,很难获得大量带有标签的高质量数据样本,且在采集振动信号时无法规避噪声的影响。基于此,提出一种基于多尺度可扩张卷积和DMWT-Mamba的小样本机械故障诊断模型。首先... 研究机械故障智能诊断技术可以保障设备安全稳定运行。在工业生产中,很难获得大量带有标签的高质量数据样本,且在采集振动信号时无法规避噪声的影响。基于此,提出一种基于多尺度可扩张卷积和DMWT-Mamba的小样本机械故障诊断模型。首先设计一个可扩张的多尺度卷积块,用于提取振动信号的多个局部感受野特征,减少学习的参数和计算量。其次将离散多小波变换(Discrete Multi-wavelet Transform,DMWT)与Mamba相结合,能够动态选择重要的时间步长信息,忽略不相关的噪声干扰,在各个频带分量中提取关键信息并使特征充分融合,从而增强模型的抗干扰性能和在小样本条件的特征提取能力。最后使用两组机械故障数据集进行实验,实验结果表明该模型能够有效提高小样本下的故障诊断准确率,且具有较强的抗干扰能力。 展开更多
关键词 故障诊断 小样本 离散多小波 mamba 多尺度卷积
在线阅读 下载PDF
结合双通道Mamba与金字塔通道注意力的事件驱动运动图像去模糊
6
作者 罗炜麒 高灿 +2 位作者 刘泓驿 夏桂松 余磊 《中国图象图形学报》 北大核心 2026年第1期243-260,共18页
目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路,但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高以及缺乏多尺度时空信息关注的问题,在复杂场景中的去模糊泛化性能... 目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路,但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高以及缺乏多尺度时空信息关注的问题,在复杂场景中的去模糊泛化性能受限。针对以上挑战,提出一种双通道Mamba去模糊网络(dual channel Mamba network,DCM-Net)。方法使用一种双通道跨模态Mamba模块(dual channel cross-modal Mamba,DCCM),通过线性复杂度的状态空间模型(state space model,SSM)隐状态映射,将事件与模糊图像投影至共享的潜在特征空间中,再通过非线性交叉门控结构,利用低噪声的模糊图像信息抑制事件噪声,并提取事件的清晰边缘特征,将其嵌入到图像特征中,实现事件和模糊图像的跨模态特征互补融合,达到去模糊的效果。此外,提出一种金字塔通道注意力模块(pyramid channel attention,PyCA)对特征的多尺度时空信息进行提取,引导网络聚焦关键时间通道,增强对空间内局部模糊的细节重建,进一步提高潜在清晰图像序列的复原精度。结果实验在合成的REDS(realistic and diverse scenes)数据集与半合成的HQF(high quality frames)数据集上进行,与11种方法进行了比较。与DeMo-IVF方法相比,本文方法在REDS数据集重建序列的峰值信噪比(peak signal-to-noise ratio,PSNR)平均提升了0.16 dB,结构相似性指数(structural similarity,SSIM)平均提升了0.003;在HQF数据集上,PSNR和SSIM分别平均提升约0.11 dB和0.002;在两个数据集上的序列重建结果的学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)达到最优。在与其中5种较先进方法进行比较的主观对比实验中,本文方法取得最佳评分。结论本文方法可以结合模糊图像和事件数据,重建出清晰潜在图像序列,证明了所提网络框架的有效性。 展开更多
关键词 运动图像去模糊 事件相机 mamba模型 金字塔通道注意力 跨模态融合
原文传递
基于TimeVAE的1DCNN-S-Mamba组合模型光伏功率短期预测
7
作者 许可证 文中 王秋杰 《热力发电》 北大核心 2026年第1期122-133,共12页
针对极端天气下光伏功率预测存在的气象响应失准、突变特征捕捉困难及数据稀缺等问题,提出一种基于模糊C均值(fuzzy C-means,FCM)、最大信息系数(maximum information coefficient,MIC)、时序变分自编码器(time variational auto-encode... 针对极端天气下光伏功率预测存在的气象响应失准、突变特征捕捉困难及数据稀缺等问题,提出一种基于模糊C均值(fuzzy C-means,FCM)、最大信息系数(maximum information coefficient,MIC)、时序变分自编码器(time variational auto-encoders,TimeVAE)、一维卷积神经网络(1D convolutional neural network,1DCNN)和simple-Mamba(S-Mamba)的组合功率预测模型。首先,通过气象特征结合FCM聚类将天气划分为晴天、多云、降雪和降雨4类;然后,结合MIC筛选出最佳气象特征子集,同时针对极端天气样本匮乏问题,采用Time VAE进行数据生成,利用其分解式重构机制生成仿真数据;最后,使用1DCNN-S-Mamba组合模型通过局部卷积捕获短时突变特征,结合双向状态空间建模实现长程依赖解析进行预测。实验结果表明,该模型提升了复杂天气下光伏功率预测的时效性与准确性。相较于S-Mamba,所提模型平均绝对误差和均方根误差在降雪天气下分别降低了3.65%和5.10%。 展开更多
关键词 模糊聚类 时序变分自编码器 数据增强 一维卷积神经网络 S-mamba
在线阅读 下载PDF
基于Mamba模型的分级跨模态融合三维目标检测方法
8
作者 李明光 陶重犇 《计算机应用》 北大核心 2026年第2期572-579,共8页
针对现有基于鸟瞰视图(BEV)的跨模态融合方法在初期融合阶段忽视了对BEV特征局部信息的有效保护,导致浅层跨模态交互不足,进而制约后续深层融合效果并降低三维目标检测精度的问题,提出基于Mamba模型的分级跨模态融合三维目标检测方法。... 针对现有基于鸟瞰视图(BEV)的跨模态融合方法在初期融合阶段忽视了对BEV特征局部信息的有效保护,导致浅层跨模态交互不足,进而制约后续深层融合效果并降低三维目标检测精度的问题,提出基于Mamba模型的分级跨模态融合三维目标检测方法。该方法将Mamba的状态空间建模机制与分级融合机制深度结合,使跨模态特征映射至隐藏状态空间进行交互,以丰富局部信息,降低跨模态特征之间的差异性,并增强融合特征表达的一致性。首先,在浅层融合阶段,设计特征通道交换机制以通过交换不同传感器模态的特征通道提升浅层局部细节的保留能力,并改进Mamba模型的视觉状态空间(VSS)块以强化浅层特征间的交互;然后,在深层融合阶段,引入注意力机制与门控机制构建隐藏的特征转换,从而识别并融合模态间互补的长距离依赖特征;最后,通过通道自适应模块计算归一化原始特征上的通道关注,并自适应地学习模态内的通道关系,增强单个模态的BEV特征表示,从而弥补Mamba模型在建模通道间关系方面的不足。实验结果表明,所提方法在nuScenes和Waymo数据集上取得了优于TransFusion和结合局部-全局建模的多模态融合方法 LoGoNet(Local-to-Global Network)等方法的检测性能,在nuScenes测试集上的平均精度均值(mAP)达到72.4%,nuScenes检测得分(NDS)为73.9%,相较于基线方法 BEVFusion_mit分别提高了2.2和1.0个百分点。 展开更多
关键词 三维目标检测 跨模态融合 mamba 鸟瞰视图 自动驾驶
在线阅读 下载PDF
融合隐藏状态压缩与空间依赖感知的Mamba-Transformer雾天目标检测方法
9
作者 陈悦 许锋 宋京昊 《液晶与显示》 北大核心 2026年第2期222-239,共18页
在复杂天气与动态场景下,小目标检测易受到雾霾干扰和特征弱化的影响,现有方法在实时性和鲁棒性方面仍存在不足。为此,本文旨在构建一种兼具高效性与强鲁棒性的检测模型,以提升雾天小目标检测性能。本文提出基于Mamba-Transformer的混... 在复杂天气与动态场景下,小目标检测易受到雾霾干扰和特征弱化的影响,现有方法在实时性和鲁棒性方面仍存在不足。为此,本文旨在构建一种兼具高效性与强鲁棒性的检测模型,以提升雾天小目标检测性能。本文提出基于Mamba-Transformer的混合状态空间检测网络HS-MambaDet。首先设计融合隐藏状态压缩与状态空间建模的HSMSSD骨干结构以降低计算复杂度;随后引入包含高频感知模块与空间依赖感知模块的多尺度频空融合器(MFSF),强化小目标的细节表达与空间上下文建模。整体框架采用CNN、Transformer与Mamba的混合架构,分别实现局部特征提取、全局上下文建模与线性递归结构的高效结合。在RTTS与CityScapes数据集上的大量实验表明,HS-MambaDet在精度与效率上均优于当前主流模型。完整模型在RTTS上的预测精度为87.3%、召回率为73.1%、mAP@0.5为81.2%、mAP@(0.5~0.95)为51.0%,分别较对比模型最高提升3.8%、3.9%、3.6%和3.3%;同时推理时间为0.26 s,保持了良好的实时性。此外,在小目标场景中,本模型的mAP@0.5提升最多达4.4%,并在跨雾强度测试中表现出更强的泛化能力。HS-MambaDet通过引入高效的隐藏状态压缩机制与多尺度频空融合结构,有效增强了雾天条件下对小目标的细节感知和空间建模能力,在检测精度、鲁棒性与推理效率上均取得显著优势,为动态恶劣环境中的实时目标检测提供了一种可行且高效的解决方案。 展开更多
关键词 目标检测 mamba 高频感知 融合隐藏状态压缩
在线阅读 下载PDF
融合注意力机制的CNN-Mamba的医学图像分割方法
10
作者 马瀚词 陈辉 《宁夏师范大学学报》 2026年第1期91-102,共12页
针对磁共振图像中存在病变器官组织复杂多变和提取不完全的问题,提出一种基于Mamba和卷积神经网络的医学图像分割方法.首先,使用卷积神经网络模块以构建多级局部特征之间的相关性;其次,使用Mamba构建主干网络,增强远程建模能力,有效捕... 针对磁共振图像中存在病变器官组织复杂多变和提取不完全的问题,提出一种基于Mamba和卷积神经网络的医学图像分割方法.首先,使用卷积神经网络模块以构建多级局部特征之间的相关性;其次,使用Mamba构建主干网络,增强远程建模能力,有效捕获图像中的全局上下文信息;最后,提出基于通道注意力引导的自适应特征融合模块,在抑制背景噪声干扰的同时实现相邻层次特征之间的有效融合.在Synapse数据集上进行实验验证,该算法mIoU和mDice分别达到72.64%、83.35%.优于与之对比的其他分割方法,能够实现更精准的医学图像分割,从而辅助医生准确判断病变情况. 展开更多
关键词 医学图像分割 CNN mamba 注意力机制
在线阅读 下载PDF
一种用于医学图像分类的CNN与Mamba的融合模型
11
作者 袁伟镇 冯跃 梁淑芬 《计算机与现代化》 2026年第1期60-67,共8页
自深度学习时代以来,卷积神经网络(Convolution Neural Networks,CNN)和视觉Transformer(Vision Transformers,ViTs)已广泛用于医学图像分类任务。然而,CNN在建模长程依赖性方面存在局限,导致分类性能受限;与此同时,ViTs由于自注意力机... 自深度学习时代以来,卷积神经网络(Convolution Neural Networks,CNN)和视觉Transformer(Vision Transformers,ViTs)已广泛用于医学图像分类任务。然而,CNN在建模长程依赖性方面存在局限,导致分类性能受限;与此同时,ViTs由于自注意力机制的二次计算复杂度,在实际部署中受到计算资源的限制。近期研究表明,Mamba能够以线性复杂度有效建模长程依赖性,为高效建模提供了新思路。受此启发,本文提出一种新型的融合CNN与Mamba的医学图像分类模型CMamba。CMamba采用双分支架构CNN_Mamba,通过结合CNN与Mamba模块,分别提取局部特征和全局依赖。为增强分支间的特征交互,模型引入分支残差机制,并分别在CNN分支和Mamba分支中引入空间注意力和通道注意力机制作为特征融合模块CS_HFF,结合来自不同分支的特征,进一步增强模型的表示能力。实验结果表明,CMamba在2个医学图像数据集上均展现出优异的分类准确性和计算效率,表明其在医学图像分类任务中的竞争力和应用潜力。 展开更多
关键词 医学图像分类 深度学习 CNN mamba
在线阅读 下载PDF
基于多尺度通道空间感知Mamba的阿尔茨海默症PET影像分类方法
12
作者 黎舰泽 刘立程 吴慧东 《广东工业大学学报》 2026年第1期31-39,95,共10页
针对现有基于卷积神经网络和Transformer的医学影像诊断方法存在长程依赖建模能力不足及二次计算复杂度问题,本文提出一种基于多尺度通道空间感知Mamba模型的三维正电子发射断层扫描(Positron Emission Tomography,PET)影像分类框架SSHC... 针对现有基于卷积神经网络和Transformer的医学影像诊断方法存在长程依赖建模能力不足及二次计算复杂度问题,本文提出一种基于多尺度通道空间感知Mamba模型的三维正电子发射断层扫描(Positron Emission Tomography,PET)影像分类框架SSHCM(State Space Hybrid Convolutional Model)。该模型融合线性状态空间模型与多尺度特征交互机制,通过堆叠式LMamba块对三维体素序列进行长程动态建模;设计逐层跨尺度通道注意力融合模块实现全局上下文语义自适应融合;构建通道空间感知模块,结合大核卷积与倒置式瓶颈结构优化空间特征融合,提升病灶定位精度。在阿尔茨海默病神经影像学计划1187名受试者数据集上的结果表明:本方法的准确率和AUC较ResNet、ViT及Mamba变种模型提升明显。在AD分类任务和MCI转化预测任务中的准确率分别达到97.03%和83.33%。 展开更多
关键词 阿尔茨海默病 正电子发射断层扫描 mamba 状态空间模型 图像分类
在线阅读 下载PDF
基于Mamba改进的3D肝脏及肝肿瘤CT图像分割
13
作者 郭佳豪 胡怀飞 《现代信息科技》 2026年第3期82-87,共6页
肝脏及肝肿瘤在三维计算机断层扫描(CT)影像中的精准分割,对临床诊断与治疗规划至关重要。针对现有卷积神经网络(CNN)分割方法因感受野受限难捕长距离依赖,而Transformer分割方法在样本有限的三维医学影像中应用受限的问题,文章提出基于... 肝脏及肝肿瘤在三维计算机断层扫描(CT)影像中的精准分割,对临床诊断与治疗规划至关重要。针对现有卷积神经网络(CNN)分割方法因感受野受限难捕长距离依赖,而Transformer分割方法在样本有限的三维医学影像中应用受限的问题,文章提出基于Mamba的三维医学图像分割新模型。该模型含三维门控空间卷积模块(3DGSCM)与通道混洗上采样模块,分别提取空间关联特征与共性特征。两大模块协同增强模型对全局结构的建模能力,同时保障了精确的边界定位效果。在LiTS2017数据集上的实验结果显示,肝脏分割的Dice相似系数(DSC)达96.42%,肝肿瘤分割DSC达70.70%;在3D-IRCADb数据集上的泛化性实验中,肝脏与肝肿瘤分割DSC分别达到96.79%和67.10%。多项对比实验结果进一步验证了所提模型在分割性能上的优越性与鲁棒性。 展开更多
关键词 肝脏肿瘤分割 mamba 状态空间模型 深度学习
在线阅读 下载PDF
基于ConvNeXt-Mamba的双编码器图像伪造检测
14
作者 潘苗绒 王燚 《计算机工程与应用》 北大核心 2026年第5期336-345,共10页
图像伪造检测在网络安全领域中是一项基础且关键的任务。卷积神经网络(CNN)是当前图像伪造检测领域的主流方法,但CNN通常只能提取局部特征,难以捕获全局特征。为此,该研究提出了融合Mamba和ConvNeXt的双编码器结构,其中Mamba负责捕获全... 图像伪造检测在网络安全领域中是一项基础且关键的任务。卷积神经网络(CNN)是当前图像伪造检测领域的主流方法,但CNN通常只能提取局部特征,难以捕获全局特征。为此,该研究提出了融合Mamba和ConvNeXt的双编码器结构,其中Mamba负责捕获全局上下文特征,ConvNeXt则聚焦于局部细节特征,通过两者的协同实现特征的综合提取。为了进一步强化关键特征表达,引入通道注意力模块(SE block),通过自适应调整特征通道的权重提升特征表达能力。针对伪造区域边界复杂带来的漏检问题,增加了边缘损失以提高模型对伪造轮廓的识别准确性。在CASIAv1等4个基准数据集上的实验表明,该方法在曲线下面积(AUC)分数和F1分数上分别平均提升0.015和0.054,显著优于现有方法,尤其在复杂伪影和模糊边界场景下展现出更强鲁棒性。 展开更多
关键词 图像伪造检测 网络安全 卷积神经网络(CNN) mamba 全局特征 局部特征
在线阅读 下载PDF
基于Mamba-UNet架构的3D MRI脑肿瘤分割方法
15
作者 张野 牛大田 《计算机应用研究》 北大核心 2026年第1期305-312,共8页
多模态MRI脑肿瘤影像的精准分割对脑癌临床诊疗及预后评估至关重要。针对卷积神经网络在捕获全局上下文信息和建立长远程依赖关系方面存在的局限性,提出了基于Mamba与U-Net融合架构的PhC-ToMamba分割模型。模型在瓶颈层嵌入了ToM模块旨... 多模态MRI脑肿瘤影像的精准分割对脑癌临床诊疗及预后评估至关重要。针对卷积神经网络在捕获全局上下文信息和建立长远程依赖关系方面存在的局限性,提出了基于Mamba与U-Net融合架构的PhC-ToMamba分割模型。模型在瓶颈层嵌入了ToM模块旨在有效建模高维特征的全局信息,通过从三个方向计算特征依赖关系并交互,提取更适用于三维图像的全局特征信息;此外,为进一步提升全局特征的提取能力,提出了一种新的多面体卷积(PhConv),并将其嵌入至编码器中,显著扩大了感受野,并提升对重点目标区域的特征提取能力,有效解决了当前主流脑肿瘤图像分割模型对全局信息感知的局限性问题,增强了对关键区域的关注度。在BraTS 2021和MSD Task01_BrainTumor数据集上进行了广泛的实验。实验结果显示,PhC-ToMamba在整个肿瘤、肿瘤核心和增强肿瘤分割任务中的Dice系数分别达到了95.05%/90.46%、94.53%/89.91%和90.74%/75.91%。与其他先进方法相比,PhC-ToMamba在分割精度和参数效率方面展现了优越性,为脑肿瘤分割任务提供稳健的解决方案,从而提高了诊断准确性。 展开更多
关键词 深度学习 MRI脑肿瘤分割 多面体卷积 三维U-Net mamba
在线阅读 下载PDF
视觉Mamba:结构、应用与前景
16
作者 张鑫 智敏 +1 位作者 萨茹拉 阿日木扎 《计算机科学与探索》 北大核心 2026年第1期66-78,共13页
传统卷积神经网络(CNN)因感受野受限难以建模全局特征,视觉Transformer虽具备序列建模优势,却面临二次计算复杂度的问题,给图像处理提出了严峻的计算挑战。为此,研究者开始探索兼具高效计算与全局感知能力的新型架构,基于状态空间模型(S... 传统卷积神经网络(CNN)因感受野受限难以建模全局特征,视觉Transformer虽具备序列建模优势,却面临二次计算复杂度的问题,给图像处理提出了严峻的计算挑战。为此,研究者开始探索兼具高效计算与全局感知能力的新型架构,基于状态空间模型(SSM)的视觉Mamba模型保留序列建模能力的同时能够实现线性计算复杂度下的全局上下文建模,标志着基于状态空间模型的视觉建模迈入新阶段。详细介绍视觉Mamba块的基本框架,包括由残差模块、二维选择性扫描(SS2D)模块与前馈网络(FFN)构成的双残差结构,分析了SS2D模块中跨扫描、S6块处理与跨融合的工作机制。从扫描、堆叠和混合结构等三个方面对视觉Mamba模型进行分析和探讨,扫描方式包括顺序扫描与动态扫描,对比分析了不同扫描策略的优劣;堆叠方式分为串行Mamba、并行Mamba、U型Mamba和图Mamba四类,详解各类堆叠结构的网络构建逻辑及在多尺度特征提取、长距离依赖建模中的适配性;混合结构聚焦在与CNN、Transformer、注意力机制的融合形式,包括单一模块融合与多模块协同架构,分析各模型优缺点。通过分析指出,视觉Mamba模型解决了CNN的局部感知限制和Transformer的二次项计算复杂度,在视觉任务中优于主流基础架构,展现出了成为视觉基础架构的巨大潜力。 展开更多
关键词 视觉mamba 扫描方式 堆叠方式 混合结构
在线阅读 下载PDF
基于近红外光谱结合MS-Mamba模型的塑料包装分类方法
17
作者 管艺博 杜欣芸 张志霞 《包装工程》 北大核心 2026年第3期198-209,共12页
目的针对常见塑料包装材料外观相似、成分差异微小且传统检测方法效率低、易受人为因素影响等问题,探索近红外光谱技术结合深度学习模型在塑料包装材料快速识别中的应用潜力。方法首先利用近红外光谱仪对PET、PE、PP、PVC、PLA和PBS等... 目的针对常见塑料包装材料外观相似、成分差异微小且传统检测方法效率低、易受人为因素影响等问题,探索近红外光谱技术结合深度学习模型在塑料包装材料快速识别中的应用潜力。方法首先利用近红外光谱仪对PET、PE、PP、PVC、PLA和PBS等典型塑料包装材料进行光谱数据采集。采用Savitzky-Golay平滑、标准正态变量变换(SNV)及多元散射校正(MSC)多步策略对原始光谱进行预处理,以消除噪声与散射干扰。在此基础上,构建了一种基于多尺度Mamba(Multi-scale mamba,MS-Mamba)的分类模型,该模型利用状态空间模型(SSM)的线性复杂度优势,通过多尺度卷积支路与门控融合机制,同时捕捉光谱序列的局部纹理特征与全局长程依赖。为验证模型性能,将所提方法与传统机器学习模型(PCA-SVM、PLS-DA)及深度学习模型(LSTM、Transformer等)进行对比,并以准确率、精确率、召回率和F1分数作为评价指标。结果实验结果表明,MS-Mamba模型在分类精度与稳定性方面均显著优于传统机器学习(PCA-SVM,PLS-DA)及主流深度学习模型(ResNet,Transformer)。其中测试集准确率、精确率、召回率和F1分数分别达到99.91%、99.89%、99.88%以及99.88,且在区分PE与PP等高度相似材料时表现出极高的鲁棒性。结论本文方法能够实现塑料包装材料的快速、无损和高精度识别,为包装材料的自动化检测与绿色回收提供了一种可行的技术路径。 展开更多
关键词 近红外光谱 塑料包装分类 多尺度mamba 深度学习 无损识别
在线阅读 下载PDF
SpiralMamba:一种用于高光谱图像分类的轻量级Mamba网络
18
作者 白玉 吴昊琦 +1 位作者 张丽丽 国晗林 《电讯技术》 北大核心 2026年第2期211-220,共10页
得益于遥感领域先进算法的发展,高光谱图像分类(Hyperspectral Image Classification,HSIC)近年来取得了显著进展。然而,高光谱数据的高维特性以及有限的标注样本仍然制约了许多现有方法的效果。为了解决这些问题,提出了一种新颖的分类... 得益于遥感领域先进算法的发展,高光谱图像分类(Hyperspectral Image Classification,HSIC)近年来取得了显著进展。然而,高光谱数据的高维特性以及有限的标注样本仍然制约了许多现有方法的效果。为了解决这些问题,提出了一种新颖的分类模型:SpiralMamba。其来源于近期的Mamba模型,该模型因其具有线性复杂度的高效全局特征提取能力而广受认可。SpiralMamba包含3个主要模块:螺旋扫描嵌入(Spiral Scanning Embedding,SSE)模块最大限度地减少将图像转换为序列时空间信息的损失;高斯掩膜加权(Gaussian Mask Weighting,GMW)模块增强了中心像素周围特征的权重,从而提升了提取特征的可分类性;轻量级Mamba模块(Lightweight Mamba Module,LWM)旨在减少模型参数和计算需求,使得该模型适合于样本稀缺的高光谱图像分类任务。在Indian Pines、WHU-Hi-HanChuan和Houston2018数据集上的实验结果表明,SpiralMamba模型分类总体准确率分别达到93.10%、93.49%、91.21%。 展开更多
关键词 高光谱图像分类 螺旋扫描嵌入(SSE) 高斯掩膜加权(GMW) 轻量级mamba模块(LWM)
在线阅读 下载PDF
MTSR:Mamba-Transformer协同增强的轻量化图像超分辨率模型
19
作者 庞梦鑫 董智红 +2 位作者 曹鹏 洪京平 张鸣赟 《计算机系统应用》 2026年第3期80-92,共13页
为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足,并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题,提出一种名为MTSR的高效Mamba-Transformer协同网络.首先,构建一种混合协同架... 为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足,并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题,提出一种名为MTSR的高效Mamba-Transformer协同网络.首先,构建一种混合协同架构,通过合理配比Mamba与Transformer模块,利用Transformer卓越的跨token交互能力弥补纯Mamba模型在上下文建模方面的缺陷,实现了长程依赖建模与计算效率的有效平衡.其次,设计一种深度卷积注意力前馈网络,用以替代传统的多层感知机.此网络能够显著增强局部细节特征的提取能力和通道间的信息交互,从而减少重建过程中的像素级信息损失,从而更充分地发挥Mamba模块的性能潜力.最后,提出一个三重深度可分离浅层细化模块.该模块专注于高效捕获并增强图像的浅层特征,为后续的非线性映射提供更丰富的原始纹理信息.在5个公开基准数据集上的大量实验结果表明,所提MTSR模型相较于当前的轻量化SOTA模型SRFormer-light和MambaIR-light,峰值信噪比(PSNR)分别获得了高达0.31 dB和0.38 dB的性能增益,同时保持了Mamba高效推理速度的优势.实验结果表明,该方法为轻量化图像超分辨率领域提供了一种兼具高性能与高效率的有效解决方案. 展开更多
关键词 超分辨率 轻量化 状态空间模型 自注意力 mamba TRANSFORMER
在线阅读 下载PDF
基于双分支注意力增强Mamba模型的遥感图像字幕生成方法
20
作者 王鹏 周凯立 +2 位作者 祝好 王幸运 杜君 《上海航天(中英文)》 2026年第1期74-81,共8页
遥感图像字幕生成(RSIC)是一项结合计算机视觉和自然语言处理的任务,旨在将遥感图像转换为自然语言描述。提出了一种基于双分支注意力Mamba的图像字幕生成方法。在双分支注意力Mamba网络中,设计了一个双向扫描Mamba块,使用最新的Mamba... 遥感图像字幕生成(RSIC)是一项结合计算机视觉和自然语言处理的任务,旨在将遥感图像转换为自然语言描述。提出了一种基于双分支注意力Mamba的图像字幕生成方法。在双分支注意力Mamba网络中,设计了一个双向扫描Mamba块,使用最新的Mamba结构编码图像全局特征,通过双向扫描机理增强模型对图像空间的感知理解。双分支注意力模块使用轻量的通道-空间注意力机制,有效地实现对图像的局部特征的关注与优化,提高模型性能。基于UCM-Captions数据集和Sydney-Captions数据集的图像字幕生成实验表明:本文提出的方法相比其他现有方法表现更优。 展开更多
关键词 遥感图像字幕生成(RSIC) mamba模型 通道注意力 空间注意力
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部