基于YOLOv10的无人机复杂背景下多尺度检测模型被引量：4

Multi-Scale Detection Model for Complex Backgrounds in UAV Images based on YOLOv10

下载PDF

导出

摘要【目的】针对无人机(UAV)航拍图像中复杂背景下多尺度目标检测挑战,文章提出了一种基于YOLOv10模型改进的轻量化检测模型,以提升UAV在复杂背景下多尺度目标的检测性能。【方法】在YOLOv10模型的基础上,文章首先引入了多通道逆残差模块(MCIR),该模块通过利用多通道处理策略与逆残差(IR)结构,提升了模型在复杂背景中对多尺度目标的特征提取和融合能力;其次,文章在跨阶段部分(CSP)双卷积瓶颈层(C2f)基础上引入了卷积块注意力模块(CBAM)注意力机制得到C2f-CM,增强了复杂背景中对特征目标的定位能力;随后,文章基于MCIR和C2f-CM对YOLOv10模型的骨干网络(Backbone)和颈部网络(Neck)进行了轻量化处理,主要是在Backbone中减少下采样次数以保留更多的特征信息,在Neck中通过优化上采样和特征拼接操作,减少网络层数和复杂度,进一步降低计算开销;最后,文章将原损失函数优化为FocalEIOU,能够更精准地匹配预测框和真实框,并有效解决数据集中样本不平衡问题。【结果】实验结果表明,改进后的轻量化目标检测(LED)-YOLOv10模型相较于原始YOLOv10模型,在mAP50(平均精度)上提升了9.8%,达到了44.5%;参数量和模型大小分别减少了65.68%和51.60%,降至0.927 MB和2.700 MB。消融实验进一步验证了改进模块MCIR、C2f-CM和Focal-EIOU的有效性,显示其在提升检测精度的同时,显著降低了模型的复杂度。对比实验结果表明,LED-YOLOv10在复杂背景下的多尺度场景中综合表现最优,检测精度和模型大小均优于其他目标检测算法,检测速度也能够满足实时检测的需求。在嵌入式设备Jetson Nano中对该轻量级模型的综合性能评估也进一步表明,LED-YOLOv10更适合在资源受限的嵌入式平台部署使用。【结论】文章提出的LED-YOLOv10模型,显著提升了UAV航拍图像中复杂背景下多尺度目标检测的精度,并大幅度减少了模型参数量和大小。实验结果和检测效果也验证了文章所提方法在复杂背景下多尺度目标检测中的优越性,为UAV目标检测提供了一种高效、轻量的解决方案。【Objective】To address the challenges of multi-scale object detection in complex backgrounds of Unmanned Aerial Vehicle(UAV)aerial images,this paper proposes a lightweight detection model based on an improved YOLOv10 to enhance the detection performance of Unmanned Aerial Vehicle(UAV)s in complex backgrounds.【Methods】Based on YOLOv10,the Multichannel Inverted Residual Block(MCIR)was introduced first.This module uses a multichannel processing strategy and an Inverted Residual(IR)structure to enhance the model's feature extraction and fusion capabilities for multi-scale objects in complex backgrounds.Second,the Convolutional Block Attention Module(CBAM)was introduced into the Cross Stage Partial(CSP)Bottle-neck with 2 Convolutions(C2f)module to create the C2f-CM,which improves the localization of feature objects in complex backgrounds.Then,the backbone and neck networks of YOLOv10 were lightweighted based on MCIR and C2f-CM.This was achieved by reducing the number of downsampling operations in the backbone network to retain more feature information,and by optimizing the upsampling and feature concatenation operations in the neck network to reduce the number of layers and complexity,thereby further reducing the computational overhead.Finally,the original loss function was optimized to Focal-EIoU,which can more accurately match the predicted and real boxes and effectively address the issue of sample imbalance in the dataset.【Results】Experimental results show that the improved Lightweight Enhanced Detection(LED)-YOLOv10 model achieved a 9.8 percentage point increase in mAP50(average precision)compared to the original YOLOv10,reaching 44.5%.The parameter count and model size were reduced by 65.68%and 51.60%,respectively,to 0.927 and 2.700 MB.Ablation experiments further validated the effectiveness of the improved MCIR,C2f-CM,and Focal-EIoU modules,demonstrating significant improvements in detection accuracy while substantially reducing model complexity.Comparative experiments show that LED-YOLOv10 performs optimally in multi-scale scenarios with complex backgrounds,with superior detection accuracy and model size compared to other object detection algorithms.Its detection speed can meet the requirements for real-time detection.The comprehensive performance evaluation of this lightweight model on the embedded device Jetson Nano further indicates that LED-YOLOv10 is more suitable for deployment on resource-constrained embedded platforms.【Conclusion】The proposed LED-YOLOv10 model significantly improves the accuracy of multi-scale object detection in complex backgrounds of UAV aerial images while greatly reducing the model's parameter count and size.The experimental results and detection performance validate the superiority of the proposed method in multi-scale object detection in complex backgrounds,providing an efficient and lightweight solution for UAV object detection.

作者黄毅周纯刘欣军陈庆 HUANG Yi;ZHOU Chun;LIU Xinjun;CHEN Qing(Department of Information Engineering,Guangzhou Modern Information Engineering College,Guangzhou 510000,China;Shanghai Huaxun Network System Co.,Ltd.,Shanghai 201103,China;School of Computer and Electronic Information,Guangxi University,Nanning 530004,China)

机构地区广州现代信息工程职业技术学院信息工程学院上海华讯网络系统有限公司广西大学计算机与电子信息学院

出处《光通信研究》北大核心 2025年第5期41-48,共8页 Study on Optical Communications

基金国家自然科学基金资助项目(62003104)。

关键词无人机目标检测 YOLOv10 轻量化损失函数 UAV object detection YOLOv10 lightweight loss function

分类号 TN911.73-34 [电子电信—通信与信息系统] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1张明淳,牛春晖,刘力双,刘洋.用于无人机探测系统的红外小目标检测算法[J].激光技术,2024,48(1):114-120. 被引量：11
2安宁.全光通信网络非线性突变频率干扰检测算法[J].光通信研究,2024(3):52-56. 被引量：4
3姚楚羡,蔡皓楠,张远波,唐可懿,詹璐,周宝定.基于轻量化车载设备的道路病害检测方法[J].测绘通报,2024(5):147-150. 被引量：5
4冷佳旭,莫梦竟成,周应华,叶永明,高陈强,高新波.无人机视角下的目标检测研究进展[J].中国图象图形学报,2023,28(9):2563-2586. 被引量：36
5赵扬,杨平华,王铭振,曹逸飞.钛合金增材制造孔隙缺陷的无损检测研究进展[J].激光技术,2024,48(3):432-437. 被引量：6
6孙日明,郭虎,邹丽,毛佳奇,王胜法.融合决策下的数字序列跌倒检测方法[J].系统仿真学报,2023,35(9):2045-2053. 被引量：2
7郭庆梅,刘宁波,王中训,孙艳丽.基于深度学习的目标检测算法综述[J].探测与控制学报,2023,45(6):10-20. 被引量：75
8张润梅,肖钰霏,贾振楠,陈中,陈梓华,袁彬,曹炜威,宋娓娓.改进YOLOv7的无人机视角下复杂环境目标检测算法[J].光电工程,2024,51(5):83-93. 被引量：11
9郝紫霄,王琦.基于YOLO-v7的无人机航拍图像小目标检测改进算法[J].软件导刊,2024,23(1):167-172. 被引量：11
10胡峻峰,李柏聪,朱昊,黄晓文.改进YOLOv8的轻量化无人机目标检测算法[J].计算机工程与应用,2024,60(8):182-191. 被引量：26

二级参考文献70

1白相志,周付根,解永春,金挺.新型Top-hat变换及其在红外小目标检测中的应用[J].数据采集与处理,2009,24(5):643-649. 被引量：25
2老年人跌倒干预技术指南[J].中国实用乡村医生杂志,2012,19(8):1-13. 被引量：63
3陶然,周开利,王越,周思永.基于神经网络数据融合的目标识别方法研究[J].系统工程与电子技术,2000,22(11):42-45. 被引量：6
4李姜,郭立红.基于改进支持向量机的目标威胁估计[J].光学精密工程,2014,22(5):1354-1362. 被引量：19
5叶斌,彭嘉雄.基于形态学Top-Hat算子的小目标检测方法[J].中国图象图形学报（A辑）,2002,7(7):638-642. 被引量：73
6阮雪茜,林鑫,黄春平,弋楠,孟永乐,黄卫东.TC4激光立体成形显微组织对超声参量的影响[J].中国激光,2015,42(1):130-134. 被引量：12
7崔新壮,黄丹,刘磊,蓝日彦,吕海波,赵艳林,曹卫东,常成利.沥青路面病害力学研究进展[J].山东大学学报（工学版）,2016,46(5):68-87. 被引量：41
8裴利然,姜萍萍,颜国正.基于支持向量机的跌倒检测算法研究[J].光学精密工程,2017,25(1):182-187. 被引量：29
9刘华盛,李彦志.基于数字图像分析的公路路面病害检测技术研究[J].四川建筑,2017,37(4):99-100. 被引量：5
10马建,赵祥模,贺拴海,宋宏勋,赵煜,宋焕生,程磊,王建锋,袁卓亚,黄福伟,张健,杨澜.路面检测技术综述[J].交通运输工程学报,2017,17(5):121-137. 被引量：112

共引文献173

1徐晓斌,刘利星,王占华,张敏,李莉,侯振坤,董勤喜.基于大视景模拟技术的铁路机巡考试系统研究[J].南方职业教育学刊,2024,14(2):102-109.
2江超,杜金,南子洋,宋美.基于改进YOLOv7算法的风机塔筒系统故障识别系统[J].电力大数据,2023,26(10):17-25. 被引量：5
3潘培玉,刘宏州,孙欣,李瑞,石磊.基于多尺度特征增强的列车摘钩关键部件检测[J].信息技术与信息化,2024(1):122-125. 被引量：1
4曾业战,段志超,郭彦东,钟春良.基于ScSGB-RCNN网络的输电线路航拍绝缘子目标检测[J].电瓷避雷器,2024(1):161-169. 被引量：1
5赵侃,汪慧兰,郭娇娇,王桂丽.基于DTA-FSAF的无人机小目标检测研究[J].计算机技术与发展,2024,34(4):101-108. 被引量：4
6刘国新,朱福珍,巫红.改进YOLOv5的遥感图像目标检测[J].黑龙江大学自然科学学报,2024,41(1):109-115.
7许广荣,许建明,彭亦飞,陈奕明.基于YOLOv5的肺炎CT检测[J].自动化应用,2024,65(7):52-53. 被引量：2
8刘英龙,石峰浪,龚兴,罗增东.基于YOLOv5的无人机实时目标检测研究[J].信息记录材料,2024,25(4):137-139.
9李校林,刘大东,刘鑫满,陈泽.改进YOLOv5的无人机航拍图像目标检测算法[J].计算机工程与应用,2024,60(11):204-214. 被引量：11
10魏堂伟,张津诚,王晶,周庆燕.基于改进YOLOv7的茶叶嫩芽识别模型研究[J].智能化农业装备学报（中英文）,2024,5(2):42-50. 被引量：6

同被引文献38

1牛永锋,王喆,李竞远,王力,郁银泉,胡天兵,刘钊.南昌文体中心大跨钢结构设计与分析[J].建筑结构,2022,52(12):1-8. 被引量：6
2邵延华,张铎,楚红雨,张晓强,饶云波.基于深度学习的YOLO目标检测综述[J].电子与信息学报,2022,44(10):3697-3708. 被引量：350
3沈晓明,王鹏,熊明虎,崔健,李刚.某柔性连接大跨钢结构连廊的设计与分析[J].建筑结构,2022,52(20):128-135. 被引量：11
4张丽讷,梁岩,管品武,余政.施工顺序对大跨钢结构桩基位移影响分析[J].建筑结构,2022,52(24):126-130. 被引量：2
5宋谱怡,陈红,苟浩波.改进YOLOv5s的无人机目标检测算法[J].计算机工程与应用,2023,59(1):108-116. 被引量：30
6陆廷杰,刘东海,齐志龙.基于深度学习的水下钢结构锈蚀识别与评价[J].天津大学学报（自然科学与工程技术版）,2023,56(7):713-722. 被引量：8
7李利霞,王鑫,王军,张又元.基于特征融合与注意力机制的无人机图像小目标检测算法[J].图学学报,2023,44(4):658-666. 被引量：21
8李晓旭,李泊宁,张曦,于春雨.基于CA-Res注意力机制的YOLOv5图像火灾检测算法[J].消防科学与技术,2023,42(8):1113-1116. 被引量：13
9陈卫彪,贾小军,朱响斌,冉二飞,谢昊.基于DSM-YOLO v5的无人机航拍图像目标检测[J].计算机工程与应用,2023,59(18):226-233. 被引量：30
10陈卫东,谢晓东,岑强,陈娜兰,朱奇光.基于改进FCOS的水下目标检测算法[J].计量学报,2023,44(11):1659-1666. 被引量：4

引证文献4

1李继光.基于改进YOLOv10的大跨钢结构锈蚀损伤智能实时检测方法研究[J].建筑结构,2025,55(24):129-135.
2刘臣杰,刘巍,杨雯迪,王成.DEPA-YOLO:无人机视角下的小目标检测模型[J].计算机科学与探索,2026,20(1):266-279.
3梁嘉欣.面向无人机小目标检测的多尺度特征融合的YOLOv11n算法[J].厦门理工学院学报,2026,34(1):40-48.
4孔李沛,赵月爱,张艳,王玲.基于DTA双标签分配策略的轻量化小目标检测模型[J].计算机技术与发展,2026,36(3):99-108.

1陈安邦,万程辉,喻文杰,李凤慧,曾淑芳.基于YOLOv9算法的河道漂浮物检测[J].南昌工程学院学报,2025,44(4):88-94.
2鄢锦芳.基于零样本学习的AI生成文本检测算法研究[J].信息与电脑,2025,37(19):51-53.
3韩禹.面向遥感影像的深度学习交通设施检测方法[J].测绘与空间地理信息,2025,48(10):112-115.
4周扬眉,李姗姗,任杰,张欢.基于多路径检索的智能政务问答系统研究[J].科学咨询,2025(17):1-4. 被引量：1
5韩锋,江志远,扈佳佳,李思勃,张少南.重庆东站PocketBIM轻量化协同平台应用[J].铁路技术创新,2025(4):17-24.
6丁丽娜,袁丽英.基于YOLOv8改进的密集场景下小目标行人检测方法[J].科学技术与工程,2025,25(28):12088-12097. 被引量：1
7邓乔夫,李骁娅,郭校君.面向多标签隐性知识的文本数据挖掘算法[J].沈阳工业大学学报,2025,47(5):594-601.
8王少聪,王会强,丁小明,杜肖鹏,尹义蕾,崔建英,程明明,王艳山,闫学兰.基于改进YOLO v8n的草莓温室飞虫虫情监测方法[J].农业工程学报,2025,41(17):184-193. 被引量：1
9张琦.基于计算机视觉的深度学习图像识别算法优化研究[J].信息与电脑,2025,37(19):1-3. 被引量：4
10曾风山.面向可见光无人机遥感的轻量级检测算法研究与应用[J].地学前缘,2025,32(5):432-439. 被引量：1

光通信研究

2025年第5期

浏览历史

内容加载中请稍等...

基于YOLOv10的无人机复杂背景下多尺度检测模型被引量：4

参考文献10

二级参考文献70

共引文献173

同被引文献38

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于YOLOv10的无人机复杂背景下多尺度检测模型 被引量：4

参考文献10

二级参考文献70

共引文献173

同被引文献38

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于YOLOv10的无人机复杂背景下多尺度检测模型被引量：4