期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
基于Mamba与注意力机制的三阴性乳腺癌超声图像分类方法
1
作者 杨颖 宋元冰 +3 位作者 张一峰 吴蓉 杜宇 郑祎 《海军军医大学学报》 北大核心 2026年第1期37-45,共9页
目的探讨一种基于Mamba与注意力机制的混合神经网络架构(MECSA-Net)在三阴性乳腺癌(TNBC)超声图像分类中的应用效果。方法回顾性收集1059幅乳腺超声图像,其中TNBC图像166幅,非TNBC图像893幅。采用图像增强技术缓解类别不平衡问题。提出... 目的探讨一种基于Mamba与注意力机制的混合神经网络架构(MECSA-Net)在三阴性乳腺癌(TNBC)超声图像分类中的应用效果。方法回顾性收集1059幅乳腺超声图像,其中TNBC图像166幅,非TNBC图像893幅。采用图像增强技术缓解类别不平衡问题。提出轻量级混合神经网络架构MECSA-Net,其特征提取模块为高效混洗感知块(SAEffBlock),由状态空间建模分支(SSM-Branch)与轻量卷积分支(EffConvBranch)组成。在分类器前端引入多尺度空洞融合注意力(MDFA)模块,以提升模型对多尺度结构的感知能力和上下文信息建模能力。结果在TNBC分类任务中,MECSA-Net准确率为93.9%、精确率为94.4%、F1分数为93.9%、AUC为0.976,整体性能优于ResNet-18、ResNet-50、EfficientNet-B0、ViT-Base和MedMamba-T等主流模型。混淆矩阵分析显示,该模型对TNBC与非TNBC样本均具备较高的识别准确性和较低的误判率。消融实验进一步验证了EffConvBranch与MDFA模块在局部纹理建模与多尺度结构判别中的关键作用,显著增强了模型的分类性能与鲁棒性。结论MECSA-Net在TNBC超声图像分类中表现出优异的准确性与鲁棒性,具备良好的临床应用前景,可为TNBC术前智能辅助诊断提供技术支持。 展开更多
关键词 三阴性乳腺癌 超声图像 深度学习 mamba 状态空间建模 注意力机制
原文传递
基于Vision Mamba模型的渔业监测物种分类性能比较
2
作者 张泽海 黄小双 +2 位作者 孔祥洪 刘必林 陈新军 《上海海洋大学学报》 北大核心 2026年第2期508-519,共12页
渔业电子观察员(Electronic monitoring)是实施渔业智能化监管的重要手段,图像识别是其支撑的关键技术之一,如何解决边缘计算场景下部署高性能、轻量化模型是目前面临的挑战。本研究引入深度学习领域的Vision Mamba(ViM)模型,该模型利... 渔业电子观察员(Electronic monitoring)是实施渔业智能化监管的重要手段,图像识别是其支撑的关键技术之一,如何解决边缘计算场景下部署高性能、轻量化模型是目前面临的挑战。本研究引入深度学习领域的Vision Mamba(ViM)模型,该模型利用选择性状态空间机制(State space model,SSM)构建双向编码器,在保持线性计算复杂度的同时实现了对图像长距离依赖关系的全局建模。研究以自然保护协会渔业监测数据集为基础,与ResNet、EfficientNet、DeiT等主流模型开展了系统性的性能对比研究。结果显示,ViM模型在效率与精度上均表现出卓越性能。在轻量级模型中,ViM-Tiny在比ResNet-18基线模型少44.28%参数量的情况下,准确率提升了1.12%,F1分数提升了2.19%。在中量级模型中,ViM-Small在参数量相较ResNet-101基线模型减少44.65%的情况下,仍能实现与之接近持平的准确率(0.960 3)与F1分数(0.964 5)。研究表明,ViM模型能够在显著降低模型复杂度的同时,仍保持强大的渔业物种分类能力,在轻量化与高精度之间取得了很好的平衡。研究为构建高效、智能的渔业监管系统提供了新的技术路径。 展开更多
关键词 渔业电子观察员 图像分类 Vision mamba模型 深度学习 渔业监测数据集
原文传递
结合双通道Mamba与金字塔通道注意力的事件驱动运动图像去模糊
3
作者 罗炜麒 高灿 +2 位作者 刘泓驿 夏桂松 余磊 《中国图象图形学报》 北大核心 2026年第1期243-260,共18页
目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路,但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高以及缺乏多尺度时空信息关注的问题,在复杂场景中的去模糊泛化性能... 目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路,但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高以及缺乏多尺度时空信息关注的问题,在复杂场景中的去模糊泛化性能受限。针对以上挑战,提出一种双通道Mamba去模糊网络(dual channel Mamba network,DCM-Net)。方法使用一种双通道跨模态Mamba模块(dual channel cross-modal Mamba,DCCM),通过线性复杂度的状态空间模型(state space model,SSM)隐状态映射,将事件与模糊图像投影至共享的潜在特征空间中,再通过非线性交叉门控结构,利用低噪声的模糊图像信息抑制事件噪声,并提取事件的清晰边缘特征,将其嵌入到图像特征中,实现事件和模糊图像的跨模态特征互补融合,达到去模糊的效果。此外,提出一种金字塔通道注意力模块(pyramid channel attention,PyCA)对特征的多尺度时空信息进行提取,引导网络聚焦关键时间通道,增强对空间内局部模糊的细节重建,进一步提高潜在清晰图像序列的复原精度。结果实验在合成的REDS(realistic and diverse scenes)数据集与半合成的HQF(high quality frames)数据集上进行,与11种方法进行了比较。与DeMo-IVF方法相比,本文方法在REDS数据集重建序列的峰值信噪比(peak signal-to-noise ratio,PSNR)平均提升了0.16 dB,结构相似性指数(structural similarity,SSIM)平均提升了0.003;在HQF数据集上,PSNR和SSIM分别平均提升约0.11 dB和0.002;在两个数据集上的序列重建结果的学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)达到最优。在与其中5种较先进方法进行比较的主观对比实验中,本文方法取得最佳评分。结论本文方法可以结合模糊图像和事件数据,重建出清晰潜在图像序列,证明了所提网络框架的有效性。 展开更多
关键词 运动图像去模糊 事件相机 mamba模型 金字塔通道注意力 跨模态融合
原文传递
基于Mamba改进的3D肝脏及肝肿瘤CT图像分割
4
作者 郭佳豪 胡怀飞 《现代信息科技》 2026年第3期82-87,共6页
肝脏及肝肿瘤在三维计算机断层扫描(CT)影像中的精准分割,对临床诊断与治疗规划至关重要。针对现有卷积神经网络(CNN)分割方法因感受野受限难捕长距离依赖,而Transformer分割方法在样本有限的三维医学影像中应用受限的问题,文章提出基于... 肝脏及肝肿瘤在三维计算机断层扫描(CT)影像中的精准分割,对临床诊断与治疗规划至关重要。针对现有卷积神经网络(CNN)分割方法因感受野受限难捕长距离依赖,而Transformer分割方法在样本有限的三维医学影像中应用受限的问题,文章提出基于Mamba的三维医学图像分割新模型。该模型含三维门控空间卷积模块(3DGSCM)与通道混洗上采样模块,分别提取空间关联特征与共性特征。两大模块协同增强模型对全局结构的建模能力,同时保障了精确的边界定位效果。在LiTS2017数据集上的实验结果显示,肝脏分割的Dice相似系数(DSC)达96.42%,肝肿瘤分割DSC达70.70%;在3D-IRCADb数据集上的泛化性实验中,肝脏与肝肿瘤分割DSC分别达到96.79%和67.10%。多项对比实验结果进一步验证了所提模型在分割性能上的优越性与鲁棒性。 展开更多
关键词 肝脏肿瘤分割 mamba 状态空间模型 深度学习
在线阅读 下载PDF
基于多尺度通道空间感知Mamba的阿尔茨海默症PET影像分类方法
5
作者 黎舰泽 刘立程 吴慧东 《广东工业大学学报》 2026年第1期31-39,95,共10页
针对现有基于卷积神经网络和Transformer的医学影像诊断方法存在长程依赖建模能力不足及二次计算复杂度问题,本文提出一种基于多尺度通道空间感知Mamba模型的三维正电子发射断层扫描(Positron Emission Tomography,PET)影像分类框架SSHC... 针对现有基于卷积神经网络和Transformer的医学影像诊断方法存在长程依赖建模能力不足及二次计算复杂度问题,本文提出一种基于多尺度通道空间感知Mamba模型的三维正电子发射断层扫描(Positron Emission Tomography,PET)影像分类框架SSHCM(State Space Hybrid Convolutional Model)。该模型融合线性状态空间模型与多尺度特征交互机制,通过堆叠式LMamba块对三维体素序列进行长程动态建模;设计逐层跨尺度通道注意力融合模块实现全局上下文语义自适应融合;构建通道空间感知模块,结合大核卷积与倒置式瓶颈结构优化空间特征融合,提升病灶定位精度。在阿尔茨海默病神经影像学计划1187名受试者数据集上的结果表明:本方法的准确率和AUC较ResNet、ViT及Mamba变种模型提升明显。在AD分类任务和MCI转化预测任务中的准确率分别达到97.03%和83.33%。 展开更多
关键词 阿尔茨海默病 正电子发射断层扫描 mamba 状态空间模型 图像分类
在线阅读 下载PDF
小样本细粒度图像分类的Mamba-小波多尺度建模方法
6
作者 仝傲 任劼 +1 位作者 孟宗阳 鲁磊 《智能科学与技术学报》 2026年第1期72-82,共11页
小样本细粒度图像分类旨在在有限标注样本条件下识别类别间细微差异,广泛应用于智能识别、生态监测及自动驾驶等领域。现有卷积结构受限于固定感受野和局部建模方式,对多尺度特征的关联描述不足,注意力或频域方法虽提升了细粒度特征的... 小样本细粒度图像分类旨在在有限标注样本条件下识别类别间细微差异,广泛应用于智能识别、生态监测及自动驾驶等领域。现有卷积结构受限于固定感受野和局部建模方式,对多尺度特征的关联描述不足,注意力或频域方法虽提升了细粒度特征的判别性,但在跨尺度依赖建模与特征融合方面仍存在局限。为提升多尺度细粒特征的表达能力,提出了一种小样本细粒度图像分类的Mamba-小波多尺度建模方法,该方法构建了Mamba状态空间建模的多尺度特征关系网络(MSFRNet)。该网络包含两大核心创新模块:小波引导动态Mamba多尺度特征提取(WDMFE)模块与交叉尺度注意力融合(CAF)模块。其中,WDMFE模块通过小波引导的动态自适应Mamba结构强化不同尺度下的频率感知与上下文建模,CAF模块采用通道与空间注意力机制整合多尺度特征以实现跨尺度补充。实验结果在CUB-200-2011、Stanford-Dogs和Stanford-Cars等基准数据集上获得了较高分类准确率,并呈现出稳定的性能提升。结果表明,该网络能够有效增强细粒度特征表达与跨任务泛化能力,并为小样本细粒度识别模型的多尺度建模提供可拓展框架。 展开更多
关键词 小样本细粒度图像分类 mamba状态空间模型 多尺度特征建模 小波引导特征提取 注意力机制 特征融合
原文传递
基于双分支注意力增强Mamba模型的遥感图像字幕生成方法
7
作者 王鹏 周凯立 +2 位作者 祝好 王幸运 杜君 《上海航天(中英文)》 2026年第1期74-81,共8页
遥感图像字幕生成(RSIC)是一项结合计算机视觉和自然语言处理的任务,旨在将遥感图像转换为自然语言描述。提出了一种基于双分支注意力Mamba的图像字幕生成方法。在双分支注意力Mamba网络中,设计了一个双向扫描Mamba块,使用最新的Mamba... 遥感图像字幕生成(RSIC)是一项结合计算机视觉和自然语言处理的任务,旨在将遥感图像转换为自然语言描述。提出了一种基于双分支注意力Mamba的图像字幕生成方法。在双分支注意力Mamba网络中,设计了一个双向扫描Mamba块,使用最新的Mamba结构编码图像全局特征,通过双向扫描机理增强模型对图像空间的感知理解。双分支注意力模块使用轻量的通道-空间注意力机制,有效地实现对图像的局部特征的关注与优化,提高模型性能。基于UCM-Captions数据集和Sydney-Captions数据集的图像字幕生成实验表明:本文提出的方法相比其他现有方法表现更优。 展开更多
关键词 遥感图像字幕生成(RSIC) mamba模型 通道注意力 空间注意力
在线阅读 下载PDF
SDA U-Mamba:基于频域动态特征融合与双极路由注意力的医学图像分割
8
作者 彭晨阳 何立风 +4 位作者 王梦溪 杜晓刚 王营博 路艳 雷涛 《智能系统学报》 北大核心 2026年第1期284-294,共11页
以Mamba为代表的状态空间模型(state space models,SSM)凭借其出色的长程依赖建模能力与较低的线性计算复杂度,在医学图像分割领域展现出广阔的应用前景。但该类方法对图像逐像素展平的处理方式会破坏图像空间结构,导致局部细节提取不足... 以Mamba为代表的状态空间模型(state space models,SSM)凭借其出色的长程依赖建模能力与较低的线性计算复杂度,在医学图像分割领域展现出广阔的应用前景。但该类方法对图像逐像素展平的处理方式会破坏图像空间结构,导致局部细节提取不足,且缺乏对器官与病灶的聚焦机制,在复杂背景下易引入冗余背景信息。为解决上述问题,本文提出了一种融合谱域动态特征与注意力机制的医学图像分割网络——频域动态注意力U型Mamba(spectral dynamic attention U-Mamba,SDA U-Mamba)。该网络采用分层U型结构设计,分别从空间连续性建模和区域聚焦能力两方面对Mamba进行优化。在网络浅层设计Mamba空频注意力模块,通过融合空域卷积、频域变换和金字塔自注意力结构以提升模型的局部信息感知能力与多尺度上下文建模效果;在网络深层引入双极路由注意力模块,通过动态路由选择与稀疏激活机制增强模型对医学图像器官或病灶的表征。实验结果表明,SDA U-Mamba在BUSI、CVCClinicDB与CHAOS-Liver这3个公开医学数据集上的分割性能显著优于当前主流方法,平均交并比(intersection over union,IoU)提升2.61%。本文所提算法可用于临床医学图像分割。 展开更多
关键词 mamba 医学图像分割 状态空间模型 谱动态特征融合 傅里叶变换 注意力 U-Net架构 多尺度特征建模
在线阅读 下载PDF
MTSR:Mamba-Transformer协同增强的轻量化图像超分辨率模型
9
作者 庞梦鑫 董智红 +2 位作者 曹鹏 洪京平 张鸣赟 《计算机系统应用》 2026年第3期80-92,共13页
为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足,并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题,提出一种名为MTSR的高效Mamba-Transformer协同网络.首先,构建一种混合协同架... 为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足,并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题,提出一种名为MTSR的高效Mamba-Transformer协同网络.首先,构建一种混合协同架构,通过合理配比Mamba与Transformer模块,利用Transformer卓越的跨token交互能力弥补纯Mamba模型在上下文建模方面的缺陷,实现了长程依赖建模与计算效率的有效平衡.其次,设计一种深度卷积注意力前馈网络,用以替代传统的多层感知机.此网络能够显著增强局部细节特征的提取能力和通道间的信息交互,从而减少重建过程中的像素级信息损失,从而更充分地发挥Mamba模块的性能潜力.最后,提出一个三重深度可分离浅层细化模块.该模块专注于高效捕获并增强图像的浅层特征,为后续的非线性映射提供更丰富的原始纹理信息.在5个公开基准数据集上的大量实验结果表明,所提MTSR模型相较于当前的轻量化SOTA模型SRFormer-light和MambaIR-light,峰值信噪比(PSNR)分别获得了高达0.31 dB和0.38 dB的性能增益,同时保持了Mamba高效推理速度的优势.实验结果表明,该方法为轻量化图像超分辨率领域提供了一种兼具高性能与高效率的有效解决方案. 展开更多
关键词 超分辨率 轻量化 状态空间模型 自注意力 mamba TRANSFORMER
在线阅读 下载PDF
基于Mamba模型的区域电价预测方法
10
作者 白晓磊 张雪元 +2 位作者 王智永 全力 刘欣 《计算机应用》 北大核心 2025年第S2期137-142,共6页
针对电力市场中电价预测精度和效率的提升需求,提出一种基于S-Mamba2(Simple-Mamba-2)模型的区域电价预测方法,以解决复杂场景中进行电价预测时的计算资源消耗高以及效率低等问题。所提方法在Mamba-2模型的基础上,引入双向Mamba-2模块... 针对电力市场中电价预测精度和效率的提升需求,提出一种基于S-Mamba2(Simple-Mamba-2)模型的区域电价预测方法,以解决复杂场景中进行电价预测时的计算资源消耗高以及效率低等问题。所提方法在Mamba-2模型的基础上,引入双向Mamba-2模块和前馈神经网络(FFN)编码层,从而有效捕捉电价历史数据中的尖峰特性、季节性规律、变量的内在互相关特性(VC)和电价的时序依赖(TD)特性。在澳大利亚电力市场运营商(AEMO)和2014年全球电力能源预测竞赛(GEFCom2014)提供的电价预测数据集上的实验结果表明,相较于T iransformer和TimeDiffusion等模型,S-Mamba2模型提升了预测性能,预测准确率最高达到97.88%。可见,所提方法为电力市场的效率提升、交易风险降低以及资源配置优化提供了有力的技术支持。 展开更多
关键词 mamba模型 状态空间模型 深度学习 电价预测
在线阅读 下载PDF
基于IHO-Mamba-MHSA的红瓜子斑鱼养殖水温多步预测模型
11
作者 徐龙琴 赫敏 +5 位作者 陈子昂 车朱泓 庞惠元 黄天佑 李红雷 刘双印 《农业机械学报》 北大核心 2025年第8期655-664,共10页
为了提高工厂化红瓜子斑鱼养殖水温预测精度,提出了一种基于改进河马优化算法(Improved hippopotamus optimization algorithm,IHO)、Mamba模型和多头自注意力机制(Multi-head self-attention,MHSA)相结合的工厂化红瓜子斑鱼养殖水温多... 为了提高工厂化红瓜子斑鱼养殖水温预测精度,提出了一种基于改进河马优化算法(Improved hippopotamus optimization algorithm,IHO)、Mamba模型和多头自注意力机制(Multi-head self-attention,MHSA)相结合的工厂化红瓜子斑鱼养殖水温多步预测模型(IHO-Mamba-MHSA)。为降低异常值和噪声干扰,分别采用四分位距(Interquartile range,IQR)法识别异常值和线性插值法填补缺失值,通过极端梯度提升(Extreme gradient boosting,XGBoost)进行关键因子特征筛选;为提高河马算法全局和局部搜索性能,提高其收敛速度,提出了差分变异、Levy飞行和柯西变异融合改进IHO优化多目标算法;为增强预测模型捕捉水温非线性关系、处理多步依赖性和全局信息的能力,提出Mamba模型与MHSA结合的预测模型;通过IHO优化并获得Mamba-MHSA模型组合参数,构建了IHO-Mamba-MHSA的工厂化红瓜子斑鱼养殖水温多步预测模型。将该模型对山东省莱州市某工厂化红瓜子斑鱼养殖水温进行验证,本文提出的IHO算法与遗传算法(Genetic algorithm,GA)、粒子群优化算法(Particle swarm optimization algorithm,PSO)和标准河马优化算法(Hippopotamus optimization algorithm,HO)相比,本文算法的MAE、MSE和MAPE分别最高降低33.33%、21.74%和18.37%,R^(2)最高提升4.42%,说明IHO具有较好的多参数优化性能;与LSTM、GRU、BPNN及TCN模型对比,本模型在各预测步长下均表现最佳,当步长为24时R^(2)仍高达0.888,充分表现其在单步与多步预测中的卓越性。各项实验结果表明本模型能够满足实际工厂化红瓜子斑鱼养殖水温精准预测与精细化管理的需求,为工厂化水产养殖水质调控提供参考。 展开更多
关键词 红瓜子斑鱼 工厂化水产养殖 水温多步预测 改进河马优化算法 mamba模型
在线阅读 下载PDF
融合Mamba与蛇形卷积的图像去模糊网络
12
作者 邱云飞 刘则延 王茂华 《中国图象图形学报》 北大核心 2025年第10期3187-3198,共12页
目的针对Transformer在图像去模糊过程中难以精确恢复图像细节的问题,提出一种结合Mamba模型与蛇形卷积技术的图像去模糊网络MSNet(Mamba snake convolution network)。方法首先,结合Mamba框架与蛇形卷积,提出蛇形状态空间模块(snake st... 目的针对Transformer在图像去模糊过程中难以精确恢复图像细节的问题,提出一种结合Mamba模型与蛇形卷积技术的图像去模糊网络MSNet(Mamba snake convolution network)。方法首先,结合Mamba框架与蛇形卷积,提出蛇形状态空间模块(snake state-space module,SSSM)。SSSM通过调整卷积核的形状和路径,动态适应图像局部特征并调整卷积方向,以对齐不同的模糊条纹模式;其次,使用多方向扫描模块(direction scan module,DSM)进行多个方向的扫描,捕捉图像中的长期依赖。再利用离散状态空间方程合并多方向的结构信息,增强模型对全局结构的捕捉能力;最后,引入蛇形通道注意力(snake channel attention,SCA),利用门控设计筛选和调整模糊信息的权重,确保在去除模糊的同时保留关键细节。结果实验在GoPro和HIDE数据集上,与主流的卷积神经网络(convolutional neural network,CNN)和Transformer去模糊方法相比,MSNet的峰值信噪比(peak signal to noise ratio,PSNR)分别提升1.2%和1.9%,结构相似性(structural similarity,SSIM)分别提升0.6%和0.7%。结论本文方法可以有效去除复杂场景下产生的图像模糊,并复原细节。 展开更多
关键词 图像去模糊 mamba模型 方向扫描模块(DSM) 蛇形卷积 蛇形通道注意力(SCA)
原文传递
基于CSC-Mamba模型的遥感图像去雾方法
13
作者 王京 何建军 +4 位作者 易善信 张俸铖 肖辉 郭洋 杨伊凡 《物探化探计算技术》 2025年第6期867-875,共9页
卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系... 卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系方面的性能卓越,受其启发,笔者设计了一种基于CSC-Mamba(Cross-Shaped Convolutional Mamba Model)视觉模型遥感图像去雾技术。该技术基于SSM设计了RSMamba模块,利用其线性复杂性来实现全局上下文编码,大大降低了模型的复杂度。同时,利用卷积神经网络CNN以及基于自注意力机制设计CSwin模块来聚合不同方向域上的特征,以有效地感知雾分布的空间变化特征。通过这种方式,CSC-Mamba能够更好地提取雾特征,从而有效地去除雾对遥感图像的影响。通过在SateHaze1K公共数据集上的实验,结果表明本CSC-Mamba模型遥感图像去雾技术不仅具有较好的轻量化特征的同时性,还具有较高的去雾效果。 展开更多
关键词 图像去雾 状态空间模型 卷积神经网络 自注意力机制 CSC-mamba模型
在线阅读 下载PDF
基于Mamba的井下皮带异物无监督检测模型研究
14
作者 马莉 吴伟雪 代新冠 《西安科技大学学报》 北大核心 2025年第2期372-382,共11页
为了解决井下皮带异物无法被精准定位、计算成本过大等问题,提出了一个基于Mamba的无监督运煤皮带异物检测模型,该模型由预训练编码器和基于Mamba的解码器组成。在Mamba解码器中,FHSS混合状态空间模块将Hilbert扫描位置编码、傅里叶变换... 为了解决井下皮带异物无法被精准定位、计算成本过大等问题,提出了一个基于Mamba的无监督运煤皮带异物检测模型,该模型由预训练编码器和基于Mamba的解码器组成。在Mamba解码器中,FHSS混合状态空间模块将Hilbert扫描位置编码、傅里叶变换、Einstein对角矩阵计算引入Mamba网络来增强通道建模及特征序列建模,并结合了基于重构方法和多类无监督异常检测的优点,解决井下异常数据集匮乏、难以采集的问题。结果表明:该模型精度比经典的4个异常检测模型分别提升了22.2%,10.9%,5.9%,2.1%,其参数量和FLOPs仅为26.109 M,8.497 G;与传统检测方法相比,不仅有效应对由于噪声、遮挡等因素导致的检测不确定性,确保了异物检测的鲁棒性和可靠性,且具备更小的模型体积,显著降低了模型在推理过程中的计算复杂度。研究对于煤矿井下的实际应用具有重要意义,能够更好地保障输送系统的安全性和稳定性。 展开更多
关键词 井下皮带异物检测 mamba 无监督训练 异常检测 空间状态模型
在线阅读 下载PDF
基于Mamba结构的轻量级皮肤病变图像分割网络 被引量:1
15
作者 贺蒙蒙 张小艳 李洪安 《图学学报》 北大核心 2025年第6期1257-1266,共10页
皮肤病变分割是医学图像分析中的一项重要任务,对于皮肤类疾病的早期诊断和治疗具有重要意义。然而,在处理高分辨率皮肤图像和捕捉细微病变特征时,现有模型仍面临着计算复杂度高以及冗余信息处理不足等挑战。为此,提出一种基于Mamba结... 皮肤病变分割是医学图像分析中的一项重要任务,对于皮肤类疾病的早期诊断和治疗具有重要意义。然而,在处理高分辨率皮肤图像和捕捉细微病变特征时,现有模型仍面临着计算复杂度高以及冗余信息处理不足等挑战。为此,提出一种基于Mamba结构的轻量级皮肤病变图像分割网络ResMamba,采用六级U型结构,主要通过将Mamba嵌入到视觉状态空间中同时引入到编解码器中,ResVSS模块作为编码器的核心组成部分,通过删除冗余线性层可减少参数量,同时结合深度卷积块和可学习尺度参数对残差连接进行缩放,从而通过降低模型复杂度来提升分割精度。在跳跃连接模块使用多级、多尺度信息融合模块生成空间和通道注意力图,有效融合了多尺度信息。通过在公开皮肤数据集ISIC2017和ISIC2018上进行实验验证,结果表明,ResMamba模型在平衡参数数量和分割性能方面都具有较好的分割性能,验证了该模型的有效性。 展开更多
关键词 深度学习 皮肤病变分割 mamba结构 状态空间模型 轻量化
在线阅读 下载PDF
卷积Mamba模型驱动的地震随机噪声压制方法 被引量:3
16
作者 韦秀娟 刘兴业 周怀来 《煤田地质与勘探》 北大核心 2025年第5期196-206,共11页
【背景】地震随机噪声压制是提升地震资料质量的关键环节之一,数据驱动的深度学习方法提供了一种智能解决方案。然而,主流的基于卷积神经网络的随机噪声智能压制方法受限于局部感受野特性,导致去噪过程中局部细节与宏观结构的协同优化不... 【背景】地震随机噪声压制是提升地震资料质量的关键环节之一,数据驱动的深度学习方法提供了一种智能解决方案。然而,主流的基于卷积神经网络的随机噪声智能压制方法受限于局部感受野特性,导致去噪过程中局部细节与宏观结构的协同优化不足,进而影响噪声压制精度。广泛应用于全局特征提取的Transformer模型通过自注意力机制能够有效捕获长距离依赖关系,理论上可弥补卷积神经网络在全局建模能力方面的局限性。但其计算慢,资源占用大,应用受限。【目的和方法】针对上述问题,提出了融合卷积Mamba的地震数据随机噪声压制网络(CMUNet)。基于二维选择性扫描技术(沿水平、垂直双方向遍历输入数据),通过状态空间方程构建全局动态系统,实现对地震数据时空特征的跨尺度特征提取,借助Mamba模型的硬件感知并行扫描算法降低计算资源消耗,保证去噪效果的同时提升计算效率。针对地震数据的特点,设计卷积-Mamba混合模块,在UNet编码器中构建层次化特征提取路径,即浅层CNN聚焦局部噪声模式识别,深层Mamba捕获大尺度地质结构关联性;进一步引入残差通道注意力门控,强化有效信号与噪声的特征可分性。【结果和结论】对于合成数据测试,提出的方法相较于UNet在信噪比、峰值信噪比和结构相似性上分别提高了2.4 dB、2.4 dB和0.0056,表现出对随机噪声的有效压制能力及对有效信号的保护能力。在野外实际地震数据应用中,局部相似性图像分析结果显示较低的局部相似值,进一步印证了该方法对有效信号的损伤程度低,展现出更优的保幅性,具有良好应用前景。 展开更多
关键词 地震随机噪声压制 深度学习 卷积神经网络 状态空间模型 mamba
在线阅读 下载PDF
基于共享提示与Mamba适配器的遥感图像文本检索方法
17
作者 杜文亮 许晓宇 +2 位作者 赵佳琦 刘兵 周勇 《电子学报》 北大核心 2025年第9期3358-3370,共13页
遥感图像文本检索旨在根据给定的图像或文本,从海量遥感图像文本数据库中快速、准确地检索出与之语义匹配的文本或图像.随着对地观测技术的飞速发展,该技术在城市规划、灾害应急响应、环境监测等领域的应用价值日益凸显,已成为当前多模... 遥感图像文本检索旨在根据给定的图像或文本,从海量遥感图像文本数据库中快速、准确地检索出与之语义匹配的文本或图像.随着对地观测技术的飞速发展,该技术在城市规划、灾害应急响应、环境监测等领域的应用价值日益凸显,已成为当前多模态信息处理领域的研究热点.基于通用数据预训练的视觉语言预训练模型,通过实现图像与文本之间的高效语义对齐,为通用图像文本检索任务奠定了技术基础.然而,通用数据与遥感数据之间存在显著的领域鸿沟,导致基于通用数据预训练的视觉语言预训练模型在直接应用于遥感任务时性能受限.因此,需要通过微调使该视觉语言模型适应遥感领域独特的数据分布.然而,现有微调方法应用到遥感领域时面临着两大核心挑战.其一,跨模态对齐不足:现有微调方法缺乏显式的跨模态信息交互机制,难以充分建模图文之间的内在关联;其二,细粒度语义表征困难:现有方法往往难以捕捉遥感图像中目标尺度差异悬殊、地物类别间相似度高、空间拓扑关系复杂等精细化的语义信息.尤其在处理小目标或由相似地物引发的语义混淆问题时性能受限,显著降低了检索准确性.本文针对遥感图像文本检索任务中跨模态对齐不足与细粒度语义表征困难的问题,提出基于共享提示与Mamba适配器的微调方法.该方法首先通过设计跨模态共享提示生成模块,建立图像与文本特征的显式交互机制;然后构建面向遥感场景的图像与文本的双分支Mamba适配器微调模块,分别实现图像与文本特征的细粒度表征;最后,采用对比损失与隶属损失,缓解由遥感图像小目标或相似地物引起的语义混淆问题.实验结果表明,本方法在遥感图像描述数据集(Remote Sensing Image Captioning Dataset,RSICD)和遥感图像文本匹配数据集(Remote Sensing Image-Text Match Dataset,RSITMD)数据集上平均召回率分别达到37.3%和48.05%,相较于当前最优的适配器微调方法分别提升3.68%和1.52%.此外,消融实验验证了共享提示生成模块与Mamba适配器的有效性. 展开更多
关键词 图像文本检索 遥感图像 mamba适配器 视觉语言模型微调
在线阅读 下载PDF
FRMamba:一种轻量化的老电影损伤修复方法
18
作者 荀镕基 朱君 +1 位作者 袁俊杰 王中杰 《系统仿真技术》 2025年第3期183-191,共9页
目前的老电影修复方法只在低分辨率画面上进行了测试,无法真实反映高分辨率电影的修复效果。此外,这些修复方法均直接对整幅画面进行修复,在算力受限的情况下难以进行推理。若先对图像进行分块,再采用分块推理的方式进行修复,在2K等电... 目前的老电影修复方法只在低分辨率画面上进行了测试,无法真实反映高分辨率电影的修复效果。此外,这些修复方法均直接对整幅画面进行修复,在算力受限的情况下难以进行推理。若先对图像进行分块,再采用分块推理的方式进行修复,在2K等电影放映级别分辨率的数据上进行测试,测试结果发现修复后的画面在不同区域存在色块与纹理不一致的问题。为此,本研究提出一种轻量级电影修复模型:FRMamba。该模型利用Mamba的线性时间复杂度特性,在保证时序建模能力的同时有效降低资源消耗。通过Mamba的全局视频建模能力与选择性扫描机制,FRMamba提升了视频帧间特征的一致性,并增强了画面损伤的检测与修复能力。在合成退化数据集和真实退化数据集上的实验结果表明,FRMamba相较于现有方法在修复效果与效率方面均具有明显优势。 展开更多
关键词 老电影修复 状态空间模型 mamba 轻量化
在线阅读 下载PDF
GLIHamba:基于Mamba的整体–局部上下文图像和谐化
19
作者 孙金胜 潘姣 +1 位作者 郭宇 姚超 《工程科学学报》 北大核心 2025年第7期1515-1524,共10页
近年来,包含Transformer组件的深度学习模型已经推动了包括图像和谐化在内的图像编辑任务的快速发展.与使用静态局部滤波器的卷积神经网络(CNN)相反,Transformer使用自注意力机制允许自适应非局部滤波来敏感地捕获远程上下文.现有基于CN... 近年来,包含Transformer组件的深度学习模型已经推动了包括图像和谐化在内的图像编辑任务的快速发展.与使用静态局部滤波器的卷积神经网络(CNN)相反,Transformer使用自注意力机制允许自适应非局部滤波来敏感地捕获远程上下文.现有基于CNN和Transformer等方法图像和谐化方法,未能很好的兼顾局部内容和整体风格的一致性,导致前景与背景的视觉一致性不足.本文提出了一种用于图像和谐化的新型网络模型,基于Mamba的整体–局部上下文图像和谐化(Globallocal context image harmonization based on Mamba,GLIHamba),将全局特征和局部特征引入到Mamba模型,建立具有整体–局部上下文感知能力的图像和谐化模型.具体来说,介绍了一种新的基于学习的图像和谐化模型GLIHamba,其核心组件包括局部特征序列提取器(LFSE)和全局特征序列提取器(GFSE).LFSE维护图像高维特征中相邻特征的局部一致性,显式地确保空间上邻近的特征沿着通道保持一致性,从而保证和谐化结果的局部内容完整一致.另一方面,GFSE在所有空间维度上建立全局序列,保持图像的整体风格一致性.研究结果表明,GLIHamba提供了优于最先进的基于CNN和Transformer的方法的性能. 展开更多
关键词 图像和谐化 状态选择空间模型 图像编辑 mamba模型 全局–局部特征提取
在线阅读 下载PDF
基于多状态空间建模Mamba的电机故障诊断方法
20
作者 徐勇军 曾德灿 《包装工程》 北大核心 2025年第15期269-276,共8页
目的提升包装装备在高负荷连续化生产场景下电机系统多状态故障诊断的精度和效率,解决传统方法对复杂动态特征捕捉不足及模型轻量化不足等问题。方法基于时频域多模态信号特征融合,构建选择性状态空间模型(Mamba)。首先,采用快速傅里叶... 目的提升包装装备在高负荷连续化生产场景下电机系统多状态故障诊断的精度和效率,解决传统方法对复杂动态特征捕捉不足及模型轻量化不足等问题。方法基于时频域多模态信号特征融合,构建选择性状态空间模型(Mamba)。首先,采用快速傅里叶变换提取电机振动信号的全局频域特征,通过连续小波变换生成时频域图像,捕捉局部动态特性;然后,设计基于结构化状态空间建模的特征融合框架,建立电机健康状态动态演化轨迹的微分方程模型;最后,构建轻量化分类器,实现多模态特征协同推理。结果在CWRU和TBVD电机数据集上的实验结果表明,通过时频域特征融合,使得故障分类准确率达到99.88%,相较于单模态方法提升了7.2%;Mamba模型的参数量仅需2.7×10^(6),比传统诊断模型减少了39.3%以上,推理速度提升了3.8倍。结论提出的多状态空间建模方法有效实现了包装装备电机故障特征的动态表征与高效融合,在保持模型轻量化的同时,显著提升了诊断精度,为智能维护系统提供了可工程化部署的解决方案。 展开更多
关键词 时频域特征融合 包装装备故障诊断 选择性状态空间模型 轻量化模型 智能化故障诊断
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部