针对水下图像目标检测算法普遍存在的误检、精度低和泛化能力弱等问题,提出一种水下图像目标检测算法AWAF-YOLO。首先,通过各向异性下采样(ADown)模块增强网络灵活性从而更加有效地获取多尺度数据特征。其次,利用小波变换卷积(WTConv)...针对水下图像目标检测算法普遍存在的误检、精度低和泛化能力弱等问题,提出一种水下图像目标检测算法AWAF-YOLO。首先,通过各向异性下采样(ADown)模块增强网络灵活性从而更加有效地获取多尺度数据特征。其次,利用小波变换卷积(WTConv)模块减轻模型复杂程度,大幅减少计算负担。然后,构建快速空间金字塔池化混合自注意力和卷积(SPPFAC)模块,通过融合注意力与跨通道交互,来提升多尺度特征判别力,更加智能地聚焦于关键特征信息,实现特征处理过程优化。最后,引入FSIoU(Focused Intersection over Union Loss and Metric Bounding Box Shape and Scale)损失函数,通过动态聚焦与几何约束耦合,实现复杂目标精准定位。实验结果表明,相较于基线模型,所提算法在TrashCan1.0数据集的平均精度均值(mAP@0.5∶0.95)提高2.6百分点,在Aquarium数据集的mAP@0.5∶0.95提高1.6百分点。结果表明所提算法具有良好的有效性和泛化性,为水下图像目标检测研究提供了一种新的思路。展开更多
文摘针对水下图像目标检测算法普遍存在的误检、精度低和泛化能力弱等问题,提出一种水下图像目标检测算法AWAF-YOLO。首先,通过各向异性下采样(ADown)模块增强网络灵活性从而更加有效地获取多尺度数据特征。其次,利用小波变换卷积(WTConv)模块减轻模型复杂程度,大幅减少计算负担。然后,构建快速空间金字塔池化混合自注意力和卷积(SPPFAC)模块,通过融合注意力与跨通道交互,来提升多尺度特征判别力,更加智能地聚焦于关键特征信息,实现特征处理过程优化。最后,引入FSIoU(Focused Intersection over Union Loss and Metric Bounding Box Shape and Scale)损失函数,通过动态聚焦与几何约束耦合,实现复杂目标精准定位。实验结果表明,相较于基线模型,所提算法在TrashCan1.0数据集的平均精度均值(mAP@0.5∶0.95)提高2.6百分点,在Aquarium数据集的mAP@0.5∶0.95提高1.6百分点。结果表明所提算法具有良好的有效性和泛化性,为水下图像目标检测研究提供了一种新的思路。