无人机载平台中的目标检测在军事和民用领域具有重要的应用价值.然而,现有的检测方法通常侧重于多尺度目标检测,缺乏对小目标的优化,且模型复杂度过高,难以在资源受限的机载平台中应用.为此,本文提出了一种面向无人机载平台的轻量级小...无人机载平台中的目标检测在军事和民用领域具有重要的应用价值.然而,现有的检测方法通常侧重于多尺度目标检测,缺乏对小目标的优化,且模型复杂度过高,难以在资源受限的机载平台中应用.为此,本文提出了一种面向无人机载平台的轻量级小目标检测算法YOLOH(You Only Look One Head).首先,针对小目标对基准网络优化,移除深层特征以减少模型参数量,增加浅层特征以获取小目标信息.其次,在特征融合部分加入NAM注意力,增强对小目标的感知能力.接着,设计了多感受野聚焦模块MRFF,以挖掘特征图的感受野信息,增强模型的多尺度检测能力.最后,使用LAMP算法对模型剪枝,去除冗余神经元以压缩模型.实验结果表明,与YOLOv8s相比,YOLOH的模型参数量和计算量分别减少了92%和35%,FPS提高了57%.在VisDrone2019和CARPK数据集上AP_(S)分别提高了3.3%和3.7%.与其他轻量级模型相比,所提YOLOH具有最佳的整体性能,同时平衡了模型大小、精度和推理速度,为无人机载平台的目标检测提供了有效的解决方案.展开更多
针对坐标注意力(CA)在水平和垂直方向特征的平均池化可能丢失目标显著特征,以及使用二维普通卷积对小目标特征学习不足的情况,提出了CARFB(coordinate attention and receptive field block)模块。该模块将CA的平均池化修改为平均+最大...针对坐标注意力(CA)在水平和垂直方向特征的平均池化可能丢失目标显著特征,以及使用二维普通卷积对小目标特征学习不足的情况,提出了CARFB(coordinate attention and receptive field block)模块。该模块将CA的平均池化修改为平均+最大池化,以保留输入特征在水平和垂直方向的显著和细节信息;利用RFB具有不同大小感受野的优势,在水平和垂直方向分别使用RFB模块代替CA的融合特征统一卷积,以同时提取不同大小目标的特征;引入包含不同大小卷积核和步长的CBS模块,替换CA的二维普通卷积,进一步提取水平和垂直方向的特征,得到重新加权的输出特征。CARFB模块在水平和垂直方向保存目标位置信息,利用不同感受野提取不同大小目标的强辨别性特征,从而具有更强的特征学习能力。为了验证提出的即插即用模块CARFB的性能,将其嵌入ObjectBox目标检测框架,得到ObjectBox-CARFB模型;用CARFB模块替换RFBnet中的RFB模块,得到CARFBnet目标检测模型。MSCOCO数据集的实验测试表明,ObjectBox-CARFB模型的性能得到全面提升,尤其对小目标的检测性能提升突出;PASCALVOC和MSCOCO数据集的实验结果表明,CARFBnet300和CARFBnet512的目标检测能力分别优于原始RFBnet300和RFBnet512模型,并优于其他同系列对比模型。提出的CARFB模块具有更强的特征学习能力,对不同尺度目标均能取得较好的检测效果,特别是在小目标检测方面,效果提升显著。提出的CARFB模块可以嵌入到任何一个卷积神经网络,能保存更多的目标信息,具有更强的特征学习能力和更高的网络性能,对不同尺度目标均能取得较好的检测效果,尤其对小目标的检测效果提升显著。展开更多
文摘无人机载平台中的目标检测在军事和民用领域具有重要的应用价值.然而,现有的检测方法通常侧重于多尺度目标检测,缺乏对小目标的优化,且模型复杂度过高,难以在资源受限的机载平台中应用.为此,本文提出了一种面向无人机载平台的轻量级小目标检测算法YOLOH(You Only Look One Head).首先,针对小目标对基准网络优化,移除深层特征以减少模型参数量,增加浅层特征以获取小目标信息.其次,在特征融合部分加入NAM注意力,增强对小目标的感知能力.接着,设计了多感受野聚焦模块MRFF,以挖掘特征图的感受野信息,增强模型的多尺度检测能力.最后,使用LAMP算法对模型剪枝,去除冗余神经元以压缩模型.实验结果表明,与YOLOv8s相比,YOLOH的模型参数量和计算量分别减少了92%和35%,FPS提高了57%.在VisDrone2019和CARPK数据集上AP_(S)分别提高了3.3%和3.7%.与其他轻量级模型相比,所提YOLOH具有最佳的整体性能,同时平衡了模型大小、精度和推理速度,为无人机载平台的目标检测提供了有效的解决方案.
文摘针对坐标注意力(CA)在水平和垂直方向特征的平均池化可能丢失目标显著特征,以及使用二维普通卷积对小目标特征学习不足的情况,提出了CARFB(coordinate attention and receptive field block)模块。该模块将CA的平均池化修改为平均+最大池化,以保留输入特征在水平和垂直方向的显著和细节信息;利用RFB具有不同大小感受野的优势,在水平和垂直方向分别使用RFB模块代替CA的融合特征统一卷积,以同时提取不同大小目标的特征;引入包含不同大小卷积核和步长的CBS模块,替换CA的二维普通卷积,进一步提取水平和垂直方向的特征,得到重新加权的输出特征。CARFB模块在水平和垂直方向保存目标位置信息,利用不同感受野提取不同大小目标的强辨别性特征,从而具有更强的特征学习能力。为了验证提出的即插即用模块CARFB的性能,将其嵌入ObjectBox目标检测框架,得到ObjectBox-CARFB模型;用CARFB模块替换RFBnet中的RFB模块,得到CARFBnet目标检测模型。MSCOCO数据集的实验测试表明,ObjectBox-CARFB模型的性能得到全面提升,尤其对小目标的检测性能提升突出;PASCALVOC和MSCOCO数据集的实验结果表明,CARFBnet300和CARFBnet512的目标检测能力分别优于原始RFBnet300和RFBnet512模型,并优于其他同系列对比模型。提出的CARFB模块具有更强的特征学习能力,对不同尺度目标均能取得较好的检测效果,特别是在小目标检测方面,效果提升显著。提出的CARFB模块可以嵌入到任何一个卷积神经网络,能保存更多的目标信息,具有更强的特征学习能力和更高的网络性能,对不同尺度目标均能取得较好的检测效果,尤其对小目标的检测效果提升显著。