期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于VMamba及金字塔特征融合双流网络的图像篡改检测
1
作者 乔博翔 张丽红 《网络新媒体技术》 2025年第4期44-53,共10页
随着图像篡改技术的不断提高,篡改者能够轻松生成高质量的篡改图像,使得人眼难以准确分辨出图像的真伪。因此,有效检测出图像篡改区域具有重要意义。本文提出一种基于VMamba模型及金字塔特征融合的双分支图像篡改检测网络。该网络由RGB... 随着图像篡改技术的不断提高,篡改者能够轻松生成高质量的篡改图像,使得人眼难以准确分辨出图像的真伪。因此,有效检测出图像篡改区域具有重要意义。本文提出一种基于VMamba模型及金字塔特征融合的双分支图像篡改检测网络。该网络由RGB分支和频域分支组成,对输入RGB图像和其小波变换频域特征分别采用VMamba模型进行多尺度特征提取,捕捉相应篡改特征,以定位伪造区域的边界和细节;然后通过双向金字塔多尺度特征融合模块对特征进行融合,特征信息双向传递使得能够在更深层次上获取高层次语义信息,同时保持细节;最后采用紧凑双线性池化对双分支特征进行进一步融合,通过分割器输出预测结果,实现图像篡改检测。在相关数据集上进行训练与测试,实验结果表明,相比其他方法,本文提出的检测网络其检测精度具有显著优势。 展开更多
关键词 图像篡改检测 小波变换 vmamba模型 双向金字塔 多尺度特征融合
在线阅读 下载PDF
VMA-UNet:基于Mamba的多尺度医学图像分割网络
2
作者 王海 李亚鸽 +1 位作者 林愉萱 陆雪松 《中南民族大学学报(自然科学版)》 2026年第1期51-59,共9页
卷积神经网络(CNN)在医学图像分割中取得了显著的进展,但其在捕捉长距离依赖信息方面存在局限性.虽然Transformer模型在处理远程依赖方面表现出色,但自注意力机制导致了较高的计算成本.为了解决这些问题,提出了多尺度医学图像分割网络VM... 卷积神经网络(CNN)在医学图像分割中取得了显著的进展,但其在捕捉长距离依赖信息方面存在局限性.虽然Transformer模型在处理远程依赖方面表现出色,但自注意力机制导致了较高的计算成本.为了解决这些问题,提出了多尺度医学图像分割网络VMA-UNet(VMamba ASPP U-Net),它融合了VMamba的VSS块结构和空洞空间卷积池化金字塔(ASPP)模块.VMA-UNet利用VSS块的线性复杂度特性,实现高效的全局信息建模,并结合ASPP模块在多个尺度上捕捉医学图像中的关键特征.通过在ACDC、COVID-19 CT和Synapse等数据集上的广泛实验,结果表明:VMA-UNet在分割精度和计算效率上均优于基于CNN和Transformer方法,显示了其在不同任务中的竞争力.VMA-UNet克服了CNN在捕捉远程信息方面的局限性,实现了高效的多尺度建模,展现了其在医学图像分割中的巨大潜力. 展开更多
关键词 医学图像分割 vmamba技术 ASPP模块 多尺度建模
在线阅读 下载PDF
DepthMamba:多尺度VisionMamba架构的单目深度估计
3
作者 徐志斌 张孙杰 《计算机应用研究》 北大核心 2025年第3期944-948,共5页
在单目深度估计领域,虽然基于CNN和Transformer的模型已经得到了广泛的研究,但是CNN全局特征提取不足,Transformer则具有二次计算复杂性。为了克服这些限制,提出了一种用于单目深度估计的端到端模型,命名为DepthMamba。该模型能够高效... 在单目深度估计领域,虽然基于CNN和Transformer的模型已经得到了广泛的研究,但是CNN全局特征提取不足,Transformer则具有二次计算复杂性。为了克服这些限制,提出了一种用于单目深度估计的端到端模型,命名为DepthMamba。该模型能够高效地捕捉全局信息并减少计算负担。具体地,该方法引入了视觉状态空间(VSS)模块构建编码器-解码器架构,以提高模型提取多尺度信息和全局信息的能力。此外,还设计了MLPBins深度预测模块,旨在优化深度图的平滑性和整洁性。最后在室内场景NYU_Depth V2数据集和室外场景KITTI数据集上进行了综合实验,实验结果表明:与基于视觉Transformer架构的Depthformer相比,该方法网络参数量减少了27.75%,RMSE分别减少了6.09%和2.63%,验证了算法的高效性和优越性。 展开更多
关键词 单目深度估计 vmamba Bins深度预测 状态空间模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部