期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于EE-YOLOv8s的多场景火灾迹象检测算法 被引量:2
1
作者 崔克彬 耿佳昌 《图学学报》 北大核心 2025年第1期13-27,共15页
针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征... 针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征提取网络,保证模型轻量化的同时,优化图像特征提取;引入大型可分离核注意力机制LSKA改进SPPELAN模块,将空间金字塔部分改进为SPP_LSKA_ELAN,充分捕获大范围内的空间细节信息,在复杂多变的火灾场景中提取更全面的特征,从而区分目标与相似物体的差异;Neck部分引入可变形卷积DCN和跨空间高效多尺度注意力EMA,实现C2f_DCN_EMA可变形卷积校准模块,增强对烟火目标边缘轮廓变化的适应能力,促进特征的融合与校准,突出目标特征;在Head部分增设携带有轻量级、无参注意力机制SimAM的小目标检测头,并重新规划检测头通道数,加强多尺寸目标表征能力的同时,降低冗余以提高参数有效利用率。实验结果表明,改进后的EE-YOLOv8s网络模型相较于原模型,其参数量减少了13.6%,准确率提升了6.8%,召回率提升了7.3%,mAP提升了5.4%,保证检测速度的同时,提升了火灾迹象目标的检测性能。 展开更多
关键词 烟火目标检测 EfficientNetEasy主干网络 大型可分离核注意力机制 可变形卷积校准模块 小目标检测
在线阅读 下载PDF
增强特征表示的绝缘子缺陷检测方法
2
作者 李丽芬 王明 +1 位作者 曹旺斌 梅华威 《计算机工程与设计》 北大核心 2025年第8期2373-2379,共7页
针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提... 针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提取能力;以重参数化技术为基础,提出了C2f-DBB模块,处理目标缺陷特征相似的问题;在边界框回归阶段使用MPDIoU作为损失函数,使得模型更加关注高质量锚框。实验结果表明,FLDM-YOLO模型在保证一定检测速度的前提下,mAP为91.3%,较YOLOv8模型提高了4.2%,可有效应用于实际的巡检工作。 展开更多
关键词 目标检测 绝缘子 部分卷积 主干特征提取网络 大核可分离注意力 重参数化 边界框损失函数
在线阅读 下载PDF
多尺度大核注意力特征融合网络的图像超分辨率重建
3
作者 宋霄罡 张鹏飞 +2 位作者 刘万波 鲁晓锋 黑新宏 《中国图象图形学报》 北大核心 2025年第4期1084-1099,共16页
目的图像超分辨率重建是计算机视觉领域内的基础任务。卷积神经网络通过滑动窗口机制和参数共享特性能够有效提取局部特征,但对图像远距离信息的感知能力较弱。Transformer中的自注意力机制可以更好地捕捉序列中的全局依赖关系,但同时... 目的图像超分辨率重建是计算机视觉领域内的基础任务。卷积神经网络通过滑动窗口机制和参数共享特性能够有效提取局部特征,但对图像远距离信息的感知能力较弱。Transformer中的自注意力机制可以更好地捕捉序列中的全局依赖关系,但同时会带来高额计算资源占用的问题。方法为了解决这些问题,本文提出了一种基于多尺度大核注意力特征融合网络的超分辨率重建方法MLFN(multi-scale large kernel attention feature fusion net⁃work),该网络采用多路径结构学习不同的水平特征表示,从而增强网络的多尺度提取能力。此外,设计了一种多尺度大核可分离卷积块,它兼顾了自注意力机制强大的全局信息捕捉能力和卷积强大的局部感知能力,能更好地提取全局特征与局部特征。同时,在末端加入了轻量级的标准化注意力模块,在进一步增强模型性能的同时,实现了网络模型的轻量化设计。结果基于5个公开测试数据集,与11种代表性方法进行了实验对比,结果表明本文方法在不同放大倍数下均有最佳表现,所提MLFN比信息多重蒸馏网络(iterative mean distillation network,IMDN)的峰值信噪比(peak signal-to-noise ratio,PSNR)平均提升0.2 dB,重建图像在视觉上具有明显优势。结论本文提出了一种基于多尺度大核注意力特征融合网络的超分辨率重建方法,借助精心设计的多尺度大核可分离卷积块,有效提高了网络的长距离关系建模能力,利用多路提取块引入多尺度特征进一步提高重建精度,引入标准化注意力模块在实现性能提升的同时维持较低的计算资源消耗。 展开更多
关键词 图像超分辨重建 大核可分离卷积 注意力机制 特征融合 多路学习
原文传递
改进YOLOX-S的智慧港口目标检测算法
4
作者 江鉴 袁志群 +2 位作者 高秀晶 何鸿正 谷子硕 《计算机工程与设计》 北大核心 2025年第7期2045-2053,共9页
针对单目摄像头在港口场景下面临目标检测算法识别不稳定的问题,提出一种改进YOLOX-S目标检测算法。引入大核注意力机制改进主干提取网络的特征输出与BottleNeck模块,提高算法特征提取的能力;引入中心点余弦距离损失改进目标框损失函数... 针对单目摄像头在港口场景下面临目标检测算法识别不稳定的问题,提出一种改进YOLOX-S目标检测算法。引入大核注意力机制改进主干提取网络的特征输出与BottleNeck模块,提高算法特征提取的能力;引入中心点余弦距离损失改进目标框损失函数,解决训练损失虽收敛但目标框仍抖动的问题;引入深度可分离卷积模块优化检测头模块,提高检测精度同时减少模型大小;实车录制智慧港口不同场景20 906张图片进行实验,其结果表明,改进算法与YOLOX-S相比,mAP@0.5:0.95提高5.1%,模型权重大小降低8.8%,TensorRT部署检测帧率为25.0 FPS。改进方法与实验结果可为智慧港口场景下的视觉感知算法开发提供参考。 展开更多
关键词 智慧港口 自动驾驶 目标检测 YOLOX-S算法 大核注意力机制 ACE-IOU损失 深度可分离卷积
在线阅读 下载PDF
基于YOLOv8的玉米害虫识别定位系统
5
作者 邹鑫 胡艳茹 《计算机应用》 北大核心 2025年第S1期282-288,共7页
为提高自然环境中玉米害虫识别的准确性,开发一种基于优化YOLOv8的深度学习模型YOLOv8-LAP。该模型将大型可分离卷积核注意力(LSKA)机制引入特征融合模块空间快速金字塔池化(SPPF),增强多尺度特征提取能力,提升检测性能。针对玉米害虫... 为提高自然环境中玉米害虫识别的准确性,开发一种基于优化YOLOv8的深度学习模型YOLOv8-LAP。该模型将大型可分离卷积核注意力(LSKA)机制引入特征融合模块空间快速金字塔池化(SPPF),增强多尺度特征提取能力,提升检测性能。针对玉米害虫图像检测中小目标难以捕捉、背景复杂和光照变化等挑战,在主干网络中加入AFGC(Attention for Fine-Grained Categorization)层,以进一步增强图像特征提取的效果,提升模型的泛化能力和鲁棒性。为保证实时检测和模型轻量化,引入可编程梯度信息(PGI)技术,通过辅助监督优化训练过程,减少参数并加速推理。在9种常见玉米害虫的检测中,YOLOv8-LAP模型的平均精度均值(mAP0.5)达到了95.7%,相较于原始YOLOv8模型提高了4.9个百分点。此外,为验证YOLOv8-LAP模型的效果,开发一款基于PySide6的应用程序,该应用拥有用户友好的图形用户界面(GUI),具有实时图像处理和视频分析功能,并支持静态图像、动态视频和摄像头实时目标检测。可见,YOLOv8-LAP模型在降低漏检率和误检率方面表现突出,目标定位更精准,适用于自然环境下的玉米害虫识别,并为精准施药提供技术支持。 展开更多
关键词 害虫 YOLOv8 大型可分离卷积核注意力 空间快速金字塔池化 识别 定位
在线阅读 下载PDF
基于改进YOLOv8的地铁低照度环境下侵限物体识别方法
6
作者 彭凯贝 邹健贤 吕晓军 《铁路计算机应用》 2025年第9期1-5,共5页
针对地铁低照度环境中侵限物体检测困难的问题,提出了一种基于改进YOLO(You Only Look Once)v8的侵限物体识别方法,通过集成Retinexformer低照度增强网络和大规模内核注意力(LSKA,Large Scale Kernel Attention)模块,显著改善了低对比... 针对地铁低照度环境中侵限物体检测困难的问题,提出了一种基于改进YOLO(You Only Look Once)v8的侵限物体识别方法,通过集成Retinexformer低照度增强网络和大规模内核注意力(LSKA,Large Scale Kernel Attention)模块,显著改善了低对比度目标的特征提取能力,在保持轻量化的同时提升了复杂场景下的检测性能。在自行构建的地铁低照度侵限物体数据集上进行实验验证,结果表明:改进YOLOv8后得到的Retinexformer-LSKA-YOLOv8n模型在mAP50-95指标上达到0.839,相比原始YOLOv8n模型提升约9.24%,较传统Faster R-CNN模型提升32.19%。该模型在识别性能上有较为显著的提升,能够较为准确地检测地铁低照度场景下的侵限物体,为地铁安全运营提供技术支持。 展开更多
关键词 地铁 侵限检测 低照度环境 YOLOv8 Retinexformer 大规模内核注意力(lska)
在线阅读 下载PDF
基于边缘特征增强的钢材表面缺陷检测方法
7
作者 李加城 龙海洋 +1 位作者 贵永亮 张浩东 《软件工程》 2025年第11期57-61,共5页
针对YOLOv8在边缘特征提取方面的局限性,提出了一种改进的Backbone结构。设计了一种边缘特征增强模块,利用Sobel算子计算图像亮度梯度以识别边缘位置,并将边缘信息与纹理信息融合以增强图像特征的表示;引入了双层路由注意力机制,增强模... 针对YOLOv8在边缘特征提取方面的局限性,提出了一种改进的Backbone结构。设计了一种边缘特征增强模块,利用Sobel算子计算图像亮度梯度以识别边缘位置,并将边缘信息与纹理信息融合以增强图像特征的表示;引入了双层路由注意力机制,增强模型对关键信息的捕捉能力;对快速空间金字塔池化(Spatial Pyramid Pooling-Fast,SPPF)模块集成大核分离卷积注意力机制(Large Kernel Separation Convolution Attention mechanism,LSKA),提升了模型对多尺度特征的聚合能力。实验结果表明,改进后模型精确率和平均精度均值分别提高了5.9%和1.9%,为钢材表面缺陷的检测任务提供了参考。 展开更多
关键词 缺陷检测 YOLOv8n 边缘特征增强 大核分离卷积 注意力机制
在线阅读 下载PDF
基于改进YOLOv8算法的道路充电桩检测
8
作者 王嘉辉 彭道刚 曹一纯 《上海电力大学学报》 2025年第3期243-250,共8页
近年来,道路充电桩常常因摆放不规范而引发安全隐患,因此首要任务是精准定位道路充电桩并对其进行识别检测。面对道路充电桩环境复杂、形态多样以及可能存在电缆线体积过小或被遮挡等问题,提出了一种基于改进YOLOv8算法的道路充电桩检... 近年来,道路充电桩常常因摆放不规范而引发安全隐患,因此首要任务是精准定位道路充电桩并对其进行识别检测。面对道路充电桩环境复杂、形态多样以及可能存在电缆线体积过小或被遮挡等问题,提出了一种基于改进YOLOv8算法的道路充电桩检测模型。首先,通过将C2f模块中的卷积替换为DCNv3,构建了C2f_DCNv3模块,以增强特征表示,减少冗余并提升性能,从而有效应对电缆线常见的形变问题;其次,通过优化损失函数,使用WIoU替换CIoU,以更好地应对道路充电桩场景复杂的问题,并提升检测精度;最后,通过引入大型可分离核注意力模块,精准捕捉充电桩特征,提升表示能力。实验结果显示,与YOLOv8n相比。该算法在mAP50和mAP50-95上分别提升了4.7%和2.8%,为道路充电桩的识别检测提供了有力支撑。 展开更多
关键词 YOLOv8算法 道路充电桩检测 大型可分离核注意力 WIoU
在线阅读 下载PDF
一种基于改进型YOLOv5s的结直肠息肉检测算法QB-YOLO
9
作者 张子健 徐建宇 杨欢 《软件导刊》 2025年第6期41-48,共8页
在医学影像领域,结直肠息肉的早期检测对预防结直肠癌等疾病至关重要。在实际医疗操作中,自动化检测结直肠息肉的准确率受制于多种特殊条件。为此,提出基于改进型YOLOv5s的结直肠息肉检测模型QB-YOLO。首先,在原骨干网络中引入一种局部... 在医学影像领域,结直肠息肉的早期检测对预防结直肠癌等疾病至关重要。在实际医疗操作中,自动化检测结直肠息肉的准确率受制于多种特殊条件。为此,提出基于改进型YOLOv5s的结直肠息肉检测模型QB-YOLO。首先,在原骨干网络中引入一种局部上下文信息增强模块——通道注意力机制(CAM),替换原模型中的空间金字塔池化SPPF模块,以增强模型对结直肠息肉的目标关注度;其次,在骨干网络中添加大核分离卷积注意力模块(LSKA模块),加强模型捕捉结直肠息肉图像中局部细节的能力;最后,将软非极大值抑制Soft-NMS引入模型以应对部分结直肠息肉可能会密集分布的情况,使模型更高效地处理重叠目标和密集目标。实验表明,改进后模型的准确率、召回率、平均精度相较于原始模型提升4.1%、8.5%、3.9%。 展开更多
关键词 YOLOv5s 结直肠息肉 目标检测 局部上下文信息增强 大核分离卷积注意力 软非极大值抑制
在线阅读 下载PDF
基于YOLOv8的遥感图像目标检测方法研究
10
作者 王江月 《网络新媒体技术》 2025年第3期38-45,共8页
遥感图像中需要识别的目标种类繁多,尺寸微小,而且图像背景模糊,导致检测精度不佳。为了应对这一挑战,本文提出基于YOLOv8单阶段网络的改进方法。在YOLOv8的骨干网络中引入多维协作注意力机制,通过对特征图的宽、高和通道方向分别进行... 遥感图像中需要识别的目标种类繁多,尺寸微小,而且图像背景模糊,导致检测精度不佳。为了应对这一挑战,本文提出基于YOLOv8单阶段网络的改进方法。在YOLOv8的骨干网络中引入多维协作注意力机制,通过对特征图的宽、高和通道方向分别进行不同的注意力加权,提高模型对关键特征的提取能力;在骨干网络与颈部网络连接处引入大核分离卷积,扩大模型的感受野,增强对目标特征的全局捕获能力;通过损失函数WIOU调整梯度增益分配,减少负样本带来的影响,更好地适应不同形状和大小的目标检测任务。实验表明,改进后的YOLOv8模型平均检测精度达到85.9%,相比YOLOv8模型提升1.3%,且优于其他对比检测算法。 展开更多
关键词 遥感图像检测 YOLOv8 多维协作注意力机制 大核分离卷积 WIOU
在线阅读 下载PDF
基于多重机制优化YOLOv8的复杂环境下安全帽检测方法 被引量:7
11
作者 肖振久 严肃 曲海成 《计算机工程与应用》 CSCD 北大核心 2024年第21期172-182,共11页
为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,提出了一种基于多重机制的安全帽检测方法。以YOLOv8n为基础将Backbone部分的C2f模块加入可扩张残差(DWR)注意力模... 为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,提出了一种基于多重机制的安全帽检测方法。以YOLOv8n为基础将Backbone部分的C2f模块加入可扩张残差(DWR)注意力模块,使得网络能够更灵活地适应不同尺度的特征,以而更准确地识别图像中的物体;采用可变形卷积AKConv模块取代主干部分中的原始Conv,为卷积神经网络带来了显著的性能提升,从而实现更高效的特征提取。此外引用了大型可分离核注意力LSKA模块与SPPF结构相结合,大大增强了模型核心的融合能力。在Safety helmet数据集的实验结果表明,改进后的算法相较于原模型,mAP@0.5指标上提升了10.5个百分点,在mAP@0.5-0.95指标上提升了3.7个百分点,能有效提高复杂场景下的安全帽佩戴检测精度。 展开更多
关键词 安全帽 YOLOv8n DWR模块 AKConv模块 lska模块
在线阅读 下载PDF
智慧教育下基于改进YOLOv8的学生课堂行为检测算法 被引量:14
12
作者 曾钰琦 刘博 +1 位作者 钟柏昌 钟瑾 《计算机工程》 CAS CSCD 北大核心 2024年第9期344-355,共12页
为了加快教育的数字化转型,人工智能技术融入教与学全过程行为的精准分析与实证应用已成为当前的研究热点。针对目前学生课堂行为检测中存在的检测精度低、目标框密度高、重叠遮挡严重、尺度变化大以及数据量不平衡等问题,创建学生课堂... 为了加快教育的数字化转型,人工智能技术融入教与学全过程行为的精准分析与实证应用已成为当前的研究热点。针对目前学生课堂行为检测中存在的检测精度低、目标框密度高、重叠遮挡严重、尺度变化大以及数据量不平衡等问题,创建学生课堂行为数据集DBS Dataset,并提出一种基于改进YOLOv8的学生课堂行为检测算法VWE-YOLOv8。首先引入注意力机制CSWin-Transformer,增强模型对图像全局信息的提取能力,提高网络的检测精度;然后集成大可分离核心注意力(LSKA)模块到SPPF架构中,增加模型在多尺度目标上的识别能力;接着将遮挡感知注意力机制融入到检测头的设计中,将原有的Head结构修改为SEAMHead,实现模型对遮挡物体的有效检测;最后引入权重调整函数Slide Loss来处理样本不均衡问题。实验结果表明,与YOLOv8相比,在DBS Dataset和公开数据集SCB Dataset上,改进后VWE-YOLOv8的mAP@0.50分别提高了1.16%、1.70%,mAP@0.50∶0.95分别提高了7.36%、2.13%,精度分别提升了4.17%、6.74%,召回率分别提升了1.96%、3.13%,说明该算法具有更高的检测精度和较强的泛化能力,能够胜任学生课堂行为的检测任务,有力支撑智慧教育应用,助力教育数字化转型。 展开更多
关键词 智慧教育 学生行为检测 目标检测 注意力机制 大可分离核心注意力模块
在线阅读 下载PDF
面向无人机视角下小目标检测的YOLOv8s改进模型 被引量:41
13
作者 潘玮 韦超 +1 位作者 钱春雨 杨哲 《计算机工程与应用》 CSCD 北大核心 2024年第9期142-150,共9页
从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(conce... 从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。 展开更多
关键词 无人机 小目标检测 YOLOv8s 感受野注意力 大型可分离卷积
在线阅读 下载PDF
基于YOLOv8的轻量化水下目标检测算法 被引量:5
14
作者 梁秀满 赵佳阳 于海峰 《红外技术》 CSCD 北大核心 2024年第9期1015-1024,共10页
针对复杂水下环境导致水下目标检测时出现误检、漏检以及检测效率低等问题,提出了一种改进YOLOv8模型的轻量化水下目标检测算法。首先,为了改善颈部网络特征融合不足的问题,将YOLOv8的颈部网络融合(Bidirectional Feature Pyramid Netwo... 针对复杂水下环境导致水下目标检测时出现误检、漏检以及检测效率低等问题,提出了一种改进YOLOv8模型的轻量化水下目标检测算法。首先,为了改善颈部网络特征融合不足的问题,将YOLOv8的颈部网络融合(Bidirectional Feature Pyramid Network,BiFPN)双向特征金字塔结构,提高小目标层的检测效果;其次,针对网络中卷积模块参数量大和计算复杂度高的问题,设计了一种自适应注意力下采样(Adaptive-Attention Down-Sampling,AADS)模块,将主干网络中的卷积模块替换为AADS模块,降低模型参数量和计算量;最后,引入大可分离核注意力机制(Large Separable Kernel Attention,LSKA),强化特征提取能力,使模型能够更精确地关注重要信息,提高目标检测精度。将改进的网络在水下目标检测数据集中进行实验,改进后的算法与YOLOv8相比,平均检测精度提升了1.4%,模型计算复杂度降低了15.9%,模型参数量减少了43.3%,使检测精度和检测速度之间达到了很好的平衡。 展开更多
关键词 YOLOv8 水下目标检测 大可分离核注意力机制 轻量化 多尺度特征融合
在线阅读 下载PDF
改进YOLOv7的轻量化交通标志检测算法 被引量:5
15
作者 李禹纬 付锐 刘帆 《太原理工大学学报》 北大核心 2024年第1期195-203,共9页
【目的】针对现有交通标志检测算法中的较大计算量和较高参数量的问题,提出一种改进YOLOv7的轻量化交通标志检测算法。【方法】该算法分为输入、提取特征的骨干网络、融合特征的颈部网络和对目标进行预测的头部网络4个部分。在骨干网络... 【目的】针对现有交通标志检测算法中的较大计算量和较高参数量的问题,提出一种改进YOLOv7的轻量化交通标志检测算法。【方法】该算法分为输入、提取特征的骨干网络、融合特征的颈部网络和对目标进行预测的头部网络4个部分。在骨干网络引入大核卷积,增大了有效感受野,提升了骨干网络提取特征的能力;检测颈部融合坐标注意力、随机池化等方法,既能构建通道注意力又能捕捉准确位置,同时提升网络的泛化能力;此外,提出集中综合深度可分离卷积模块,在减少参数量的同时更好地提取图像特征。【结果】实验结果表明,本文算法在CCTSDB2021数据集上的检测精度达到了93.13%,mAP也达到了87.59%,相较于同类型的方法有了较大的提高,该网络在较低的参数量和计算量的情况下实现了较高的精确率,不仅能够精准地捕捉交通标志的位置信息,同时能够准确地对交通标志进行预测。 展开更多
关键词 交通标志检测 轻量化 大核卷积 坐标注意力 深度可分离卷积
在线阅读 下载PDF
平衡锚框位置偏差的大核注意力小目标检测方法
16
作者 冉同霄 闫建红 《太原师范学院学报(自然科学版)》 2024年第4期10-18,共9页
针对小目标图像像素低、背景复杂和特征难提取等问题,提出改进的YOLOv5小目标检测模型.首先,为扩大感受野,增强模型多尺度特征提取能力,基于CSP(Cross Stage Partial)思想,在YOLOv5s模型的SPPF模块中,引入相似性注意力(Similarity-based... 针对小目标图像像素低、背景复杂和特征难提取等问题,提出改进的YOLOv5小目标检测模型.首先,为扩大感受野,增强模型多尺度特征提取能力,基于CSP(Cross Stage Partial)思想,在YOLOv5s模型的SPPF模块中,引入相似性注意力(Similarity-based Attention Mechanism,SimAM)和大型可分离核注意力(Large Separable Kernel Attention,LSKA),组成大核注意力的金字塔池化方法(LK-SPPF);其次,为解决锚框质量和位置偏差的问题,使用能聚焦普通质量锚框的WIoU损失函数,在此基础上,增加归一化Wasserstein距离NWD(Normalized Wasserstein Distance)指标,即WIoU-NWD损失函数;最后,为进一步增强检测头表示能力,获取更有用的小目标特征,在检测头使用融入自注意力的大尺度特征图.本模型在VisDrone2019数据集上进行实验,结果显示,与YOLOv5s相比,该模型的F1-score、mAP@0.5和mAP@0.5:0.95分别提高了8.6%、9.9%和7.2%,表明该模型能准确地对小目标进行检测. 展开更多
关键词 YOLOv5 小目标检测 Wise IoU 大型可分离核注意力 归一化Wasserstein距离
在线阅读 下载PDF
LESO-Net:一种轻量高效的小目标分割网络
17
作者 丁正龙 胡一凡 +3 位作者 杜元洪 徐炜杰 魏哑美 姚选 《南京信息工程大学学报》 2025年第6期766-776,共11页
图像内的部分小目标因其具有形状不规则以及边界模糊等特征,在分割处理时常常遭遇诸多挑战,主要包括特征提取困难、边缘细节丢失、噪声干扰显著等.针对以上问题,本文提出一种基于YOLOv8n-seg模型的轻量高效的小目标分割网络LESO-Net.首... 图像内的部分小目标因其具有形状不规则以及边界模糊等特征,在分割处理时常常遭遇诸多挑战,主要包括特征提取困难、边缘细节丢失、噪声干扰显著等.针对以上问题,本文提出一种基于YOLOv8n-seg模型的轻量高效的小目标分割网络LESO-Net.首先,使用可变形卷积网络(DCNv2)替换骨干网络中的C2f模块,以提高对不同形状小目标的特征提取和自适应泛化能力;然后,将大可分离核注意力(LSKA)模块引入到颈部网络中,以提高分割精确度,降低计算复杂度和内存占用;最后,通过对损失函数进行优化,改善类别不平衡和边界框精确度不足的问题.在自建的气泡数据集和SAR公共图像数据集(HRSID)上进行的实验结果表明,改进后的网络LESO-Net与原始YOLOv8n-seg模型相比,精确度分别提高1.2和2.5个百分点,mAP50分别提高0.2和1.2个百分点,参数量减少10%,证明所提出的LESO-Net模型具有较好的综合性能,能够满足复杂场景中小目标分割任务的要求. 展开更多
关键词 小目标 YOLOv8n-seg 可变形卷积 大可分离核注意力
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部