针对复杂背景中行人小目标的检测精度低以及检测不及时的问题,提出了一种改进的Mamba行人小目标检测方法。首先,在主干网络中将标准卷积替换成感受野注意力卷积(RFAConv),通过动态感受野调整了模型对多尺度特征的捕捉能力,同时优化了计...针对复杂背景中行人小目标的检测精度低以及检测不及时的问题,提出了一种改进的Mamba行人小目标检测方法。首先,在主干网络中将标准卷积替换成感受野注意力卷积(RFAConv),通过动态感受野调整了模型对多尺度特征的捕捉能力,同时优化了计算效率。其次,将注意力机制融入视觉状态空间模型(Visual State Space Model,VSSM)中,实现行人小目标多尺度特征的提取。最后,在颈部利用特征增强模块(Feature Enhancement Module,FEM)和双向金字塔模型实现多尺度特征融合。实验结果表明:在HIT-UAV数据集上,改进的Mamba模型实现了81.25%的准确率(以mAP@0.5为标准),比现有的大型模型如YOLOv5、YOLOv8、YOLOv11高出15%以上。展开更多
卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系...卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系方面的性能卓越,受其启发,笔者设计了一种基于CSC-Mamba(Cross-Shaped Convolutional Mamba Model)视觉模型遥感图像去雾技术。该技术基于SSM设计了RSMamba模块,利用其线性复杂性来实现全局上下文编码,大大降低了模型的复杂度。同时,利用卷积神经网络CNN以及基于自注意力机制设计CSwin模块来聚合不同方向域上的特征,以有效地感知雾分布的空间变化特征。通过这种方式,CSC-Mamba能够更好地提取雾特征,从而有效地去除雾对遥感图像的影响。通过在SateHaze1K公共数据集上的实验,结果表明本CSC-Mamba模型遥感图像去雾技术不仅具有较好的轻量化特征的同时性,还具有较高的去雾效果。展开更多
文摘针对复杂背景中行人小目标的检测精度低以及检测不及时的问题,提出了一种改进的Mamba行人小目标检测方法。首先,在主干网络中将标准卷积替换成感受野注意力卷积(RFAConv),通过动态感受野调整了模型对多尺度特征的捕捉能力,同时优化了计算效率。其次,将注意力机制融入视觉状态空间模型(Visual State Space Model,VSSM)中,实现行人小目标多尺度特征的提取。最后,在颈部利用特征增强模块(Feature Enhancement Module,FEM)和双向金字塔模型实现多尺度特征融合。实验结果表明:在HIT-UAV数据集上,改进的Mamba模型实现了81.25%的准确率(以mAP@0.5为标准),比现有的大型模型如YOLOv5、YOLOv8、YOLOv11高出15%以上。