期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于Vision Mamba模型的渔业监测物种分类性能比较
1
作者 张泽海 黄小双 +2 位作者 孔祥洪 刘必林 陈新军 《上海海洋大学学报》 北大核心 2026年第2期508-519,共12页
渔业电子观察员(Electronic monitoring)是实施渔业智能化监管的重要手段,图像识别是其支撑的关键技术之一,如何解决边缘计算场景下部署高性能、轻量化模型是目前面临的挑战。本研究引入深度学习领域的Vision Mamba(ViM)模型,该模型利... 渔业电子观察员(Electronic monitoring)是实施渔业智能化监管的重要手段,图像识别是其支撑的关键技术之一,如何解决边缘计算场景下部署高性能、轻量化模型是目前面临的挑战。本研究引入深度学习领域的Vision Mamba(ViM)模型,该模型利用选择性状态空间机制(State space model,SSM)构建双向编码器,在保持线性计算复杂度的同时实现了对图像长距离依赖关系的全局建模。研究以自然保护协会渔业监测数据集为基础,与ResNet、EfficientNet、DeiT等主流模型开展了系统性的性能对比研究。结果显示,ViM模型在效率与精度上均表现出卓越性能。在轻量级模型中,ViM-Tiny在比ResNet-18基线模型少44.28%参数量的情况下,准确率提升了1.12%,F1分数提升了2.19%。在中量级模型中,ViM-Small在参数量相较ResNet-101基线模型减少44.65%的情况下,仍能实现与之接近持平的准确率(0.960 3)与F1分数(0.964 5)。研究表明,ViM模型能够在显著降低模型复杂度的同时,仍保持强大的渔业物种分类能力,在轻量化与高精度之间取得了很好的平衡。研究为构建高效、智能的渔业监管系统提供了新的技术路径。 展开更多
关键词 渔业电子观察员 图像分类 vision mamba模型 深度学习 渔业监测数据集
原文传递
卷积增强Vision Mamba模型的构建及其应用 被引量:1
2
作者 俞焕友 范静 黄凡 《计算机技术与发展》 2025年第8期45-52,共8页
针对Vision Mamba(Vim)模型的局限性,该文提出了一种改进的模型——Convolutional Vision Mamba(CvM)。此模型通过摒弃Vim中的图形切割和位置编码机制,转而采用卷积操作进行替代,以实现对全局视觉信息的更高效处理。同时,此模型对Vim模... 针对Vision Mamba(Vim)模型的局限性,该文提出了一种改进的模型——Convolutional Vision Mamba(CvM)。此模型通过摒弃Vim中的图形切割和位置编码机制,转而采用卷积操作进行替代,以实现对全局视觉信息的更高效处理。同时,此模型对Vim模型中的位置嵌入模块进行了优化,以解决其固有的高计算量和内存消耗问题。进而,该文将CvM模型应用于医学图像分类领域,选用了血细胞图像、脑肿瘤图像、胸部CT扫描、病理性近视眼底图像以及肺炎X射线影像等数据集进行实验。实验结果表明,与Vim模型及其他5个神经网络模型相比,CvM模型在准确率上表现更为出色,在内存占用和参数数量方面也展现出明显的优势。消融实验表明,深度可分离卷积比标准卷积使用的参数和显存占用更少,而且在血细胞图像、脑肿瘤图像等医学图像分类上,准确率还有了显著提升。这些结果充分说明了CvM模型的优势和可行性。 展开更多
关键词 深度学习 vision mamba 卷积神经网络 深度可分离卷积 医学图像分类
在线阅读 下载PDF
基于Vision Mamba的矿井低照度图像增强算法
3
作者 王德强 《电子制作》 2025年第8期69-71,共3页
由于煤矿井下光源少、光照均匀度不高,通过监控设备采集到的图像往往存在大面积暗区、照度不足等问题;另外井下图像数据集获取困难,基于循环生成对抗网络的增强算法虽可实现自主训练,但增强后的图像仍存在细节特征不明显以及缺失等问题... 由于煤矿井下光源少、光照均匀度不高,通过监控设备采集到的图像往往存在大面积暗区、照度不足等问题;另外井下图像数据集获取困难,基于循环生成对抗网络的增强算法虽可实现自主训练,但增强后的图像仍存在细节特征不明显以及缺失等问题,极大地影响了图像质量。针对上述问题,利用新型Vision Mamba的远程信息依赖强的优势,提出一种基于Vision Mamba改进生成对抗网络的矿井低照度图像增强算法;利用Vision Mamba改进原有的生成器,强化图像远程信息感知,设计Patch-GAN判别器避免忽略局部纹理特征,最后改进传统对抗损失函数保证模型的训练速度。经直观视觉与数值实验表明,提出的模型不仅能够增强井下采集图像的亮度,同时还能够强化细节特征、提升图像质量,更好地满足了井上人员对于井下低照度图像增强的实际需求。 展开更多
关键词 煤矿图像增强 vision mamba网络 生成对抗网络
在线阅读 下载PDF
基于改进U-Mamba网络的聚酯纤维超微结构分割算法
4
作者 周宇 隗兵 +2 位作者 郝矿荣 皋磊 王华平 《纺织学报》 北大核心 2026年第1期72-79,共8页
针对工业生产中聚酯纤维超微结构中的团聚效应对产品的颜色均匀性、机械性能均匀性及光泽度等性能的负面影响这一问题,提出一种基于改进U-Mamba的聚酯纤维超微结构分割算法。首先利用扫描电子显微镜采集聚酯纤维超微结构中团聚粒子分布... 针对工业生产中聚酯纤维超微结构中的团聚效应对产品的颜色均匀性、机械性能均匀性及光泽度等性能的负面影响这一问题,提出一种基于改进U-Mamba的聚酯纤维超微结构分割算法。首先利用扫描电子显微镜采集聚酯纤维超微结构中团聚粒子分布的高分辨率图像并建立对应的超微结构数据集以评估模型性能,使用结合边缘检测算法的预训练神经网络对纤维图像进行去噪、滤波以及自动着色处理,通过设计高阶视觉状态空间模块和多尺度信息融合模块,改进后的U-Mamba深度网络模型能够准确识别并分割超微结构中团聚体。实验结果表明:在超微结构数据集下,该算法对比其它经典算法具有较高的分割准确性,其交并比达到78.9%,平均准确率达到96.1%,能够满足工业生产中机器视觉技术在高功能纤维超微结构分析中的应用需求。 展开更多
关键词 聚酯纤维 超微结构分布 机器视觉 U-mamba算法 语义分割
在线阅读 下载PDF
多尺度注意力聚合视觉Mamba-UNet的遥感图像显著性目标检测方法
5
作者 张善文 郭能念 +2 位作者 邵彧 李萍 许新华 《电光与控制》 北大核心 2026年第2期1-6,13,共7页
针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS... 针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS)模块构建,利用VSS和CASC有效获取遥感图像(RSI)中的长距离依赖关系,在瓶颈层引入空洞多尺度注意力聚合(DMSAA)模块,有效整合局部-全局特征,提取多尺度小目标的细节特征。该模型整合了多尺度卷积、注意力机制、U-Net与Mamba-UNet的优势,提高了RSISOD的性能。在大规模RSI数据集EORSSD中的飞机图像子集上进行了实验。结果表明,MSAAVMamba-UNet能够精确检测RSI中的显著性多尺度小目标,精度达到84.07%,该方法为RSISOD系统提供了技术支持。 展开更多
关键词 遥感图像 显著性目标检测 空洞多尺度注意力聚合 mamba-UNet 多尺度注意力聚合视觉mamba-UNet
在线阅读 下载PDF
UltraLight CrackNet:基于VMamba的轻量化裂缝分割网络
6
作者 成荣 朱文忠 王文 《电子测量技术》 北大核心 2025年第22期224-234,共11页
裂缝检测在土木基础设施维护中具有关键作用。传统人工视觉检测方法存在诸多缺陷,推动了裂缝检测技术的持续发展。然而,现有裂缝检测技术仍面临复杂背景干扰、特征多样性干扰及高计算资源需求的挑战。本研究挖掘Mamba模型在视觉任务中... 裂缝检测在土木基础设施维护中具有关键作用。传统人工视觉检测方法存在诸多缺陷,推动了裂缝检测技术的持续发展。然而,现有裂缝检测技术仍面临复杂背景干扰、特征多样性干扰及高计算资源需求的挑战。本研究挖掘Mamba模型在视觉任务中的潜力,提出一种超轻量裂缝检测网络(UltraLight CrackNet),其包含3个核心模块:并行轻量化视觉Mamba模块(通过高效建模长程依赖关系提取深层语义特征)、多尺度残差视觉状态空间模块(增强多尺度特征表征能力),以及改进的语义-细节融合模块(优化编码器-解码器架构的跳跃连接机制)。实验表明,该方法仅需0.13 M参数量与1.96 G浮点运算量,在超轻量模型设计下,于DeepCrack和Crack500数据集分别取得87.85%和77.92%的平均交并比mIoU,达到最优性能;在SteelCrack数据集获得可比结果,且参数量较现有对比模型中参数量最小的模型降低87.85%。 展开更多
关键词 裂缝检测 视觉mamba 轻量化模型 语义分割 特征融合
原文传递
基于PVM的Seam Carving篡改检测算法
7
作者 赵洁 常皓婵 +1 位作者 王浩天 武斌 《重庆科技大学学报(自然科学版)》 2026年第1期70-79,共10页
针对现有Seam Carving篡改检测算法在应对JPEG压缩、高斯模糊和高斯噪声等后处理攻击时鲁棒性和泛化性不足的问题,提出了一种基于金字塔视觉Mamba(PVM)的Seam Carving篡改检测算法。首先,构建PVM编码器,利用其多尺度建模能力捕获篡改痕... 针对现有Seam Carving篡改检测算法在应对JPEG压缩、高斯模糊和高斯噪声等后处理攻击时鲁棒性和泛化性不足的问题,提出了一种基于金字塔视觉Mamba(PVM)的Seam Carving篡改检测算法。首先,构建PVM编码器,利用其多尺度建模能力捕获篡改痕迹的全局上下文信息;其次,设计八方向局部注意力机制,以检测接缝操作引发的相关性异常;最后,在损失函数中引入鲁棒性增强正则项,以有效抑制高斯噪声带来的干扰。实验结果表明,在BOSSbase1.01数据集上,该算法对JPEG压缩、高斯模糊等常见后处理操作的检测性能明显优于现有主流篡改检测算法,展现出了优异的鲁棒性和泛化性。 展开更多
关键词 接缝裁剪 后处理场景 图像篡改检测 vision mamba 鲁棒性
在线阅读 下载PDF
A Semantic-Guided State-Space Learning Framework for Low-Light Image Enhancement
8
作者 Xi Cai Xiaoqiang Wang +1 位作者 Huiying Zhao Guang Han 《Computers, Materials & Continua》 2026年第5期1137-1157,共21页
Low-light image enhancement(LLIE)remains challenging due to underexposure,color distortion,and amplified noise introduced during illumination correction.Existing deep learning–based methods typically apply uniform en... Low-light image enhancement(LLIE)remains challenging due to underexposure,color distortion,and amplified noise introduced during illumination correction.Existing deep learning–based methods typically apply uniform enhancement across the entire image,which overlooks scene semantics and often leads to texture degradation or unnatural color reproduction.To overcome these limitations,we propose a Semantic-Guided Visual Mamba Network(SGVMNet)that unifies semantic reasoning,state-space modeling,and mixture-of-experts routing for adaptive illumination correction.SGVMNet comprises three key components:(1)a semantic modulation module(SMM)that extracts scene-aware semantic priors from pretrained multimodal models—Large Language and Vision Assistant(LLaVA)and Contrastive Language–Image Pretraining(CLIP)—and injects them hierarchically into the feature stream;(2)aMixture-of-Experts State-Space Feature EnhancementModule(MoE-SSMFEM)that dynamically selects informative channels and activates specialized state-space experts for efficient global–local illumination modeling;and(3)a Text-Guided Mixture Mamba Block(TGMB)that fuses semantic priors and visual features through bidirectional state propagation.Experimental results demonstrate that on the low-light(LOL)dataset,SGVMNet outperforms other state-of-the-art methods in both quantitative and qualitative evaluations,and it also maintains low computational complexity with fast inference speed.On LOLv2-Syn,SGVMNet achieves 26.512 dB PSNR and 0.935 SSIM,outperforming RetinexFormer by 0.61 dB.On LOLv1,SGVMNet attains 26.50 dB PSNR and 0.863 SSIM.Furthermore,experiments on multiple unpaired real-world datasets further validate the superiority of SGVMNet,showing that the model not only exhibits strong cross-scene generalization ability but also effectively preserves semantic consistency and visual naturalness. 展开更多
关键词 Noise interference attention mechanism vision mamba semantic modulation low-light image enhancement
在线阅读 下载PDF
SSViM:用于高光谱图像分类的空间光谱Vision Mamba网络
9
作者 张豪 陈景霞 《激光与光电子学进展》 2026年第4期486-495,共10页
近年来,卷积神经网络和Transformer在高光谱图像分类任务中得到了广泛应用。然而,卷积神经网络由于其感受野的限制,难以有效捕获像素间的全局关系特征和长距离上下文信息,导致在后续的分类任务中无法充分利用空间光谱特征,分类精度受到... 近年来,卷积神经网络和Transformer在高光谱图像分类任务中得到了广泛应用。然而,卷积神经网络由于其感受野的限制,难以有效捕获像素间的全局关系特征和长距离上下文信息,导致在后续的分类任务中无法充分利用空间光谱特征,分类精度受到制约。相比之下,Transformer虽然在建模高光谱图像空间光谱特征的长期依赖性方面具有优势,但其二次计算复杂度的问题使得在实际分类任务中仍存在局限性。针对这些问题,提出了一种基于Vision Mamba的网络模型SSViM。Vision Mamba不仅具备强大的长距离建模能力,还能保持线性计算复杂度。通过在PaviaU、HanChuan和HongHu三个公开的高光谱图像数据集上的实验验证,表明该方法可以有效提升高光谱图像的分类性能。 展开更多
关键词 卷积神经网络 Transformer 高光谱图像分类 vision mamba 长距离建模
原文传递
基于深度学习的医学图像分割方法综述 被引量:6
10
作者 石军 王天同 +3 位作者 朱子琦 赵敏帆 王炳勋 安虹 《中国图象图形学报》 北大核心 2025年第6期2161-2186,共26页
医学图像分割是临床医学图像分析的重要组成部分,目标是准确识别和分割医学图像中的人体解剖结构或病灶等感兴趣区域,为临床疾病的诊断、治疗规划以及术后评估等应用场景提供客观、量化的决策依据。随着可用标注数据规模的不断增长,基... 医学图像分割是临床医学图像分析的重要组成部分,目标是准确识别和分割医学图像中的人体解剖结构或病灶等感兴趣区域,为临床疾病的诊断、治疗规划以及术后评估等应用场景提供客观、量化的决策依据。随着可用标注数据规模的不断增长,基于深度学习的医学图像分割方法迅速发展,展现出远超传统图像分割方法的精度和鲁棒性,已成为该领域的主流技术。为了进一步提高分割精度,大量研究集中在对分割模型的结构改进上,产生了一系列结构迥异的分割方法。总的来说,现有的基于深度学习的医学图像分割方法从模型结构上可以分为3类:基于卷积神经网络(convolutional neural network, CNN)、基于视觉Transformer以及基于视觉Mamba。其中,以U-Net为代表的基于CNN的方法最早广泛应用于各类医学图像分割任务。这类方法一般以卷积操作为核心,能够有效提取图像的局部特征。相比之下,基于视觉Transformer的方法更擅长捕捉全局信息和长距离依赖关系,能够更好地处理复杂的上下文信息。基于视觉Mamba的方法作为一种新兴架构,具有全局感受野和线性计算复杂度的特点,表现出巨大的应用潜力。为了深入了解基于深度学习的医学图像分割方法的发展脉络、优势与不足,本文对现有方法进行系统梳理和综述。首先简要回顾上述3类主流分割方法的结构演进历程,分析不同方法的结构特点、优势与局限性,然后从算法结构、学习方法和任务范式等多方面深入探讨医学图像分割领域面临的主要挑战及机遇,最后对基于深度学习的医学图像分割方法的未来发展方向和应用前景进行深入分析和讨论。 展开更多
关键词 深度学习(DL) 医学图像分割 卷积神经网络(CNN) 视觉Transformer(ViT) 视觉mamba
原文传递
基于多通道Mamba自适应高斯溅射网络的高精度单视图3D重建
11
作者 周三琪 《建模与仿真》 2025年第9期215-231,共17页
因缺乏多视角信息,现有单视图三维重建方法普遍难以兼顾建模精度与泛化能力。为此,本文提出一种多通道Mamba自适应高斯溅射网络(MMAGS)来实现高精度重建。该方法在网络结构上引入多通道并行Vision Mamba模块,通过通道划分与并行驱动提... 因缺乏多视角信息,现有单视图三维重建方法普遍难以兼顾建模精度与泛化能力。为此,本文提出一种多通道Mamba自适应高斯溅射网络(MMAGS)来实现高精度重建。该方法在网络结构上引入多通道并行Vision Mamba模块,通过通道划分与并行驱动提升遮挡区域的几何还原能力与跨视角结构信息的稳健提取。为增强纹理细节与图像边缘保真度,进一步提出深度–颜色双梯度感知的自适应三维高斯滤波策略,依据局部几何与纹理变化动态调整高斯协方差。所提出的方法应用于ShapeNet-SRN与CO3D两类数据集。实验结果表明,所提出的MMAGS方法展现出比现有最先进方法更高的重建精度和重建效果,具备良好的跨类别泛化能力与真实场景鲁棒性。 展开更多
关键词 单视图三维重建 3DGS vision mamba 自适应滤波
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部