针对复杂场景交通标志检测存在精确率不高的问题,提出了改进的高效多尺度注意力机制和混合小目标层的你只看一次第8版小型(improved efficient multi-scale attention mechanism and hybrid small target layer-you only look once vers...针对复杂场景交通标志检测存在精确率不高的问题,提出了改进的高效多尺度注意力机制和混合小目标层的你只看一次第8版小型(improved efficient multi-scale attention mechanism and hybrid small target layer-you only look once version 8 small, AMST-YOLOv8s)模型。首先,在主干网络的快速空间金字塔池化(spatial pyramid pooling-fast, SPPF)模块前添加改进的高效多尺度注意力(improved efficient multi-scale attention, IEMA)模块,提高交通标志的检测精确率。其次,添加混合小目标检测层,提高交通标志检测中小目标的检测精确率。最后,通过改进形状交并比(shape-intersection over union, Shape-IOU)得到明智的形状交并比(wise shape-intersection over union, WSIOU)损失函数,代替模型中边界框(complete intersection over union, CIOU)损失函数,增强模型对形状多样化目标的检测能力。在清华-腾讯100K(Tsinghua-Tencent 100k, TT100K)数据集上,AMST-YOLOv8s模型比原YOLOv8s模型的精确率提高了5.33%,召回率提高了11.30%,交并比阈值为0.5时的平均精确率均值提高了7.78%,交并比阈值为0.50~0.95时的平均精确率均值提高了6.67%;在长沙理工大学的中国交通标志检测基准(Changsha University of Science and Technology-Chinese traffic sign detection benchmark, CCTSDB)、库存量单元100K(stock keeping unit 100k, SKU-100K)、视觉无人机(visual drones, VisDrone)、视觉目标类别2007(visual object classes 2007,VOC2007)数据集上,AMST-YOLOv8s模型比原YOLOv8s模型的交并比阈值为0.5时的平均精确率均值分别提高了37.10%、0.50%、10.70%、1.17%。该模型与主流交通标志检测模型相比,具有精确率高、泛化能力强、轻量化等优点。展开更多
文摘针对复杂场景交通标志检测存在精确率不高的问题,提出了改进的高效多尺度注意力机制和混合小目标层的你只看一次第8版小型(improved efficient multi-scale attention mechanism and hybrid small target layer-you only look once version 8 small, AMST-YOLOv8s)模型。首先,在主干网络的快速空间金字塔池化(spatial pyramid pooling-fast, SPPF)模块前添加改进的高效多尺度注意力(improved efficient multi-scale attention, IEMA)模块,提高交通标志的检测精确率。其次,添加混合小目标检测层,提高交通标志检测中小目标的检测精确率。最后,通过改进形状交并比(shape-intersection over union, Shape-IOU)得到明智的形状交并比(wise shape-intersection over union, WSIOU)损失函数,代替模型中边界框(complete intersection over union, CIOU)损失函数,增强模型对形状多样化目标的检测能力。在清华-腾讯100K(Tsinghua-Tencent 100k, TT100K)数据集上,AMST-YOLOv8s模型比原YOLOv8s模型的精确率提高了5.33%,召回率提高了11.30%,交并比阈值为0.5时的平均精确率均值提高了7.78%,交并比阈值为0.50~0.95时的平均精确率均值提高了6.67%;在长沙理工大学的中国交通标志检测基准(Changsha University of Science and Technology-Chinese traffic sign detection benchmark, CCTSDB)、库存量单元100K(stock keeping unit 100k, SKU-100K)、视觉无人机(visual drones, VisDrone)、视觉目标类别2007(visual object classes 2007,VOC2007)数据集上,AMST-YOLOv8s模型比原YOLOv8s模型的交并比阈值为0.5时的平均精确率均值分别提高了37.10%、0.50%、10.70%、1.17%。该模型与主流交通标志检测模型相比,具有精确率高、泛化能力强、轻量化等优点。