针对农作物害虫检测中害虫目标被遮挡、体色与环境相近等情况导致的目标检测准确率不高的问题,提出了一种基于RT-DETR的农作物害虫检测算法RT-DETR-SDIC。首先,原主干网络的前两层(S2,S3)引入多样分支残差模块(Diverse Branch Residual ...针对农作物害虫检测中害虫目标被遮挡、体色与环境相近等情况导致的目标检测准确率不高的问题,提出了一种基于RT-DETR的农作物害虫检测算法RT-DETR-SDIC。首先,原主干网络的前两层(S2,S3)引入多样分支残差模块(Diverse Branch Residual Block,DBRB),利用多分支拓扑结构以及不同规模的路径提取多尺度的特征信息,在原主干网络的后两层(S4,S5)引入了结合级联注意力的倒立残差移动模块(Invert Residual Mobile Block with Cascade Group Attention,IRMB_CGA),弥补了原主干网络中长距离语义信息无法直接交互的问题,增强了对环境特征的辨别能力;其次,在特征融合网络中,增加了无参数注意力的空间到深度融合层(Space to Depth Convolution with Attention,SPA)提取细粒度的信息,设计了内容引导融合模块(Context Guide Fusion Module,CGFM)来引导多尺度特征融合。实验结果表明模型RT-DETR-SDIC参数下降了19.6%,计算量下降了9.9%,P_(mA,0.5)上升了6.2%,P_(mA,0.5:0.95)上升了2.6%。展开更多
近年来,草原鼠洞的迅速增殖与扩散已成为导致草原退化和生态失衡的重要因素之一。鼠洞的密集分布破坏了草皮结构,削弱土壤稳定性,降低植被覆盖度与牧草产能,严重威胁草原生态安全与畜牧业的可持续发展。针对现有检测算法在小目标识别能...近年来,草原鼠洞的迅速增殖与扩散已成为导致草原退化和生态失衡的重要因素之一。鼠洞的密集分布破坏了草皮结构,削弱土壤稳定性,降低植被覆盖度与牧草产能,严重威胁草原生态安全与畜牧业的可持续发展。针对现有检测算法在小目标识别能力不足、特征提取不充分及复杂背景干扰显著等问题,研究提出一种基于实时检测(real-time detection transformer,RT-DETR)的改进模型——RT-DETR-ECG(efficient global perception and feature selection)。该模型首先引入高效视觉Mamba网络(efficient vision Mamba,EfficientVIM)模块,通过状态空间建模与深浅层特征交互,实现全局与局部信息的高效融合,从而增强小目标特征感知与跨尺度建模能力;其次,构建卷积门控线性单元(convolutional gated linear unit,CGLU)模块,利用卷积与门控机制的协同作用动态抑制复杂背景噪声,有效突出鼠洞边缘与纹理特征;最后,设计小目标加权损失函数(CGLU-Loss),在回归阶段引入中心偏移权重与局部重叠增益项,以强化小尺度样本的梯度贡献并提升定位精度。试验基于2397张跨季节无人机(UAV)草原鼠洞图像数据集开展,结果表明:RT-DETR-ECG在检测精度、实时性与模型轻量化方面均优于现有算法。在IoU阈值为0.5时,模型的平均精度(mAP@0.5)达96.3%,较原始RT-DETR提升5.1%,检测速度达91.8帧/s,计算负载降低53.7%。该模型实现了小目标检测的精度提升与实时性能的平衡,为草原鼠洞智能识别与生态监测提供了一种高效可靠的新方法。展开更多
文摘针对农作物害虫检测中害虫目标被遮挡、体色与环境相近等情况导致的目标检测准确率不高的问题,提出了一种基于RT-DETR的农作物害虫检测算法RT-DETR-SDIC。首先,原主干网络的前两层(S2,S3)引入多样分支残差模块(Diverse Branch Residual Block,DBRB),利用多分支拓扑结构以及不同规模的路径提取多尺度的特征信息,在原主干网络的后两层(S4,S5)引入了结合级联注意力的倒立残差移动模块(Invert Residual Mobile Block with Cascade Group Attention,IRMB_CGA),弥补了原主干网络中长距离语义信息无法直接交互的问题,增强了对环境特征的辨别能力;其次,在特征融合网络中,增加了无参数注意力的空间到深度融合层(Space to Depth Convolution with Attention,SPA)提取细粒度的信息,设计了内容引导融合模块(Context Guide Fusion Module,CGFM)来引导多尺度特征融合。实验结果表明模型RT-DETR-SDIC参数下降了19.6%,计算量下降了9.9%,P_(mA,0.5)上升了6.2%,P_(mA,0.5:0.95)上升了2.6%。
文摘近年来,草原鼠洞的迅速增殖与扩散已成为导致草原退化和生态失衡的重要因素之一。鼠洞的密集分布破坏了草皮结构,削弱土壤稳定性,降低植被覆盖度与牧草产能,严重威胁草原生态安全与畜牧业的可持续发展。针对现有检测算法在小目标识别能力不足、特征提取不充分及复杂背景干扰显著等问题,研究提出一种基于实时检测(real-time detection transformer,RT-DETR)的改进模型——RT-DETR-ECG(efficient global perception and feature selection)。该模型首先引入高效视觉Mamba网络(efficient vision Mamba,EfficientVIM)模块,通过状态空间建模与深浅层特征交互,实现全局与局部信息的高效融合,从而增强小目标特征感知与跨尺度建模能力;其次,构建卷积门控线性单元(convolutional gated linear unit,CGLU)模块,利用卷积与门控机制的协同作用动态抑制复杂背景噪声,有效突出鼠洞边缘与纹理特征;最后,设计小目标加权损失函数(CGLU-Loss),在回归阶段引入中心偏移权重与局部重叠增益项,以强化小尺度样本的梯度贡献并提升定位精度。试验基于2397张跨季节无人机(UAV)草原鼠洞图像数据集开展,结果表明:RT-DETR-ECG在检测精度、实时性与模型轻量化方面均优于现有算法。在IoU阈值为0.5时,模型的平均精度(mAP@0.5)达96.3%,较原始RT-DETR提升5.1%,检测速度达91.8帧/s,计算负载降低53.7%。该模型实现了小目标检测的精度提升与实时性能的平衡,为草原鼠洞智能识别与生态监测提供了一种高效可靠的新方法。