针对井工矿复杂环境下安全帽检测面临的挑战,提出了一种改进的YOLOv8目标检测模型。井工矿环境的特殊性,如光线昏暗、粉尘弥漫、背景复杂及矿工姿态多样性,导致现有检测算法在目标遮挡、小目标识别及恶劣环境条件下的检测性能下降。为...针对井工矿复杂环境下安全帽检测面临的挑战,提出了一种改进的YOLOv8目标检测模型。井工矿环境的特殊性,如光线昏暗、粉尘弥漫、背景复杂及矿工姿态多样性,导致现有检测算法在目标遮挡、小目标识别及恶劣环境条件下的检测性能下降。为解决这些问题,从以下几个方面对YOLOv8模型进行了改进:首先,引入残差块+卷积块注意力模块(Residual Block+Convolutional Block Attention Module,ResBlock+CBAM),通过跳跃连接和注意力机制,显著提升了模型对小目标和遮挡目标的检测能力;其次,设计动态检测头,将注意力机制分解为尺度、空间和任务三个独立维度,增强了模型对目标多样性的适应能力;再次,提出用于边界框回归的损失函数——最小点距离的交并比(Minimum Point Distance based Intersection over Union,MPDIoU),综合考虑边界框的重叠面积、中心点距离以及宽度和高度偏差,优化了边界框回归的精度;最后,构建矿井安全帽检测数据集,包含4300张在复杂井下环境下拍摄的图像,用于模型的训练和验证。试验结果表明,改进后的模型在精确率、召回率、mAP50和mAP50-95等关键评价指标上均取得了显著提升。与当前主流的目标检测算法(如Faster R-CNN、SSD、YOLOXs和YOLOv8)相比,提出的模型在检测精度上大幅领先,同时保持了较低的计算复杂度(GFLOPs为16.9),使该模型更适合在实际矿井环境中实时运行。研究不仅提升了井工矿安全帽检测的准确性和鲁棒性,还为复杂环境下的目标检测任务提供了新的思路和方法,具有实际应用价值。展开更多
针对背景复杂、尺度变化较大、被遮挡情况下机械外破隐患目标检测精度不高,容易出现错检、漏检的问题,文中提出了一种改进YOLOv7(you only look once version 7)的机械外破隐患目标检测算法。文章在检测头网络中添加Swin Transformer注...针对背景复杂、尺度变化较大、被遮挡情况下机械外破隐患目标检测精度不高,容易出现错检、漏检的问题,文中提出了一种改进YOLOv7(you only look once version 7)的机械外破隐患目标检测算法。文章在检测头网络中添加Swin Transformer注意力机制提高对多尺度特征的提取能力,然后在主干网络中将部分卷积模块替换为深度可分离卷积,降低模型运算成本,采用Focal-EIOU(Focal and enhanced intersection over union)损失函数优化预测框,最后引入Mish激活函数增强网络的泛化能力,提高模型在复杂背景、目标部分被遮挡情况下的检测性能。实验结果表明,改进后的算法较原YOLOv7在准确率、召回率和平均精度均值上分别提高了5.2%、10.6%和5.2%,较其他主流算法在检测精度和模型体积上有着明显的优势,验证了改进方法的有效性,为复杂场景下机械外破隐患目标的边缘识别提供算法支持。展开更多
在艺术与科技研究领域中,针对目前大部分现有公开数据集过于老旧而导致已有研究方法在实际GUI(Graphical User Interface)检测中因界面所特有的组件种类多样、背景复杂的情况,同时因高分辨率显示器使得部分组件更小更密集从而导致检测...在艺术与科技研究领域中,针对目前大部分现有公开数据集过于老旧而导致已有研究方法在实际GUI(Graphical User Interface)检测中因界面所特有的组件种类多样、背景复杂的情况,同时因高分辨率显示器使得部分组件更小更密集从而导致检测效率不高和检测精度瓶颈等问题,该文依托太原师范学院智能科技与艺术创新科研平台自行构建GUI数据集并基于RT-DETR模型进行改进提出EM-DETR,构建面向GUI组件检测任务的实时目标检测网络创新性优化策略。为突破低质量样本与计算效率的双重限制,创新构建了引入增强定位敏感区域的表达能力模块的EMViT轻量化骨干网络;与此同时,为改善最近邻插值法可能出现细节丢失、锯齿状边缘和图像失真等问题,引入DySample上采样算子;最后为了解决低质量样本回归难题,设计基于WIoUv3的动态梯度分配策略。本实验在太原师范学院智能科技与艺术创新科研平台提供的GUI数据集中验证了检测精度及效率平衡方面的有效性。实验结果表明,检测平均精度(mAP)达到了89.8%,相较于原始RT-DETR提升了9.53百分点,同时,EM-DETR在检测速度上也表现出色,在GUI组件检测这一细分场景下,首次将RT-DETR架构的精度提高到可落地水平,在保持可接受的实时性同时大大提高了检测正确率。现已将其应用到教育部产学合作协同育人公示企业山西赛迩教育科技有限公司中的产品研发环节,取得良好效果。展开更多
文摘针对井工矿复杂环境下安全帽检测面临的挑战,提出了一种改进的YOLOv8目标检测模型。井工矿环境的特殊性,如光线昏暗、粉尘弥漫、背景复杂及矿工姿态多样性,导致现有检测算法在目标遮挡、小目标识别及恶劣环境条件下的检测性能下降。为解决这些问题,从以下几个方面对YOLOv8模型进行了改进:首先,引入残差块+卷积块注意力模块(Residual Block+Convolutional Block Attention Module,ResBlock+CBAM),通过跳跃连接和注意力机制,显著提升了模型对小目标和遮挡目标的检测能力;其次,设计动态检测头,将注意力机制分解为尺度、空间和任务三个独立维度,增强了模型对目标多样性的适应能力;再次,提出用于边界框回归的损失函数——最小点距离的交并比(Minimum Point Distance based Intersection over Union,MPDIoU),综合考虑边界框的重叠面积、中心点距离以及宽度和高度偏差,优化了边界框回归的精度;最后,构建矿井安全帽检测数据集,包含4300张在复杂井下环境下拍摄的图像,用于模型的训练和验证。试验结果表明,改进后的模型在精确率、召回率、mAP50和mAP50-95等关键评价指标上均取得了显著提升。与当前主流的目标检测算法(如Faster R-CNN、SSD、YOLOXs和YOLOv8)相比,提出的模型在检测精度上大幅领先,同时保持了较低的计算复杂度(GFLOPs为16.9),使该模型更适合在实际矿井环境中实时运行。研究不仅提升了井工矿安全帽检测的准确性和鲁棒性,还为复杂环境下的目标检测任务提供了新的思路和方法,具有实际应用价值。
文摘针对背景复杂、尺度变化较大、被遮挡情况下机械外破隐患目标检测精度不高,容易出现错检、漏检的问题,文中提出了一种改进YOLOv7(you only look once version 7)的机械外破隐患目标检测算法。文章在检测头网络中添加Swin Transformer注意力机制提高对多尺度特征的提取能力,然后在主干网络中将部分卷积模块替换为深度可分离卷积,降低模型运算成本,采用Focal-EIOU(Focal and enhanced intersection over union)损失函数优化预测框,最后引入Mish激活函数增强网络的泛化能力,提高模型在复杂背景、目标部分被遮挡情况下的检测性能。实验结果表明,改进后的算法较原YOLOv7在准确率、召回率和平均精度均值上分别提高了5.2%、10.6%和5.2%,较其他主流算法在检测精度和模型体积上有着明显的优势,验证了改进方法的有效性,为复杂场景下机械外破隐患目标的边缘识别提供算法支持。
文摘在艺术与科技研究领域中,针对目前大部分现有公开数据集过于老旧而导致已有研究方法在实际GUI(Graphical User Interface)检测中因界面所特有的组件种类多样、背景复杂的情况,同时因高分辨率显示器使得部分组件更小更密集从而导致检测效率不高和检测精度瓶颈等问题,该文依托太原师范学院智能科技与艺术创新科研平台自行构建GUI数据集并基于RT-DETR模型进行改进提出EM-DETR,构建面向GUI组件检测任务的实时目标检测网络创新性优化策略。为突破低质量样本与计算效率的双重限制,创新构建了引入增强定位敏感区域的表达能力模块的EMViT轻量化骨干网络;与此同时,为改善最近邻插值法可能出现细节丢失、锯齿状边缘和图像失真等问题,引入DySample上采样算子;最后为了解决低质量样本回归难题,设计基于WIoUv3的动态梯度分配策略。本实验在太原师范学院智能科技与艺术创新科研平台提供的GUI数据集中验证了检测精度及效率平衡方面的有效性。实验结果表明,检测平均精度(mAP)达到了89.8%,相较于原始RT-DETR提升了9.53百分点,同时,EM-DETR在检测速度上也表现出色,在GUI组件检测这一细分场景下,首次将RT-DETR架构的精度提高到可落地水平,在保持可接受的实时性同时大大提高了检测正确率。现已将其应用到教育部产学合作协同育人公示企业山西赛迩教育科技有限公司中的产品研发环节,取得良好效果。