期刊文献+
共找到120篇文章
< 1 2 6 >
每页显示 20 50 100
基于高空无人机平台的多模态跟踪数据集 被引量:2
1
作者 肖云 曹丹 +2 位作者 李成龙 江波 汤进 《中国图象图形学报》 北大核心 2025年第2期361-374,共14页
目的无人机(unmanned aerial vehicle,UAV)因易操纵、灵活等特点,近年来在军事和民用等多个领域得到广泛应用。相对于低空无人机,高空无人机具有更广的视野,更强的隐蔽性,在情报侦察、灾害救援等方面具有更高的应用价值。然而,现有无人... 目的无人机(unmanned aerial vehicle,UAV)因易操纵、灵活等特点,近年来在军事和民用等多个领域得到广泛应用。相对于低空无人机,高空无人机具有更广的视野,更强的隐蔽性,在情报侦察、灾害救援等方面具有更高的应用价值。然而,现有无人机多模态目标跟踪研究主要针对低空无人机,缺乏高空无人机多模态目标跟踪数据集,限制了该领域的研究和发展。方法构建了一个用于评估高空无人机多模态目标跟踪方法的数据集HiAl(high altitude UAV multi-modal tracking dataset),该数据集主要由搭载混合传感器的无人机在500 m高空拍摄的可见光—红外多模态视频构成,两种模态数据经过精确配准和帧级标注,可以较好地评估不同多模态目标跟踪方法在高空无人机平台下的性能表现。结果将主流的12种多模态跟踪方法在所提数据集与非高空无人机场景数据集上的表现进行了比较,方法TBSI(template-bridged search region interaction)在RGBT234数据集(RGBthermal dataset)上PR(precision rate)值达到0.871,而在本文所提数据集上仅0.527,下降了39.5%,其SR(success rate)值由RGBT234数据集上的0.637,下降到本文所提数据集上的0.468,下降了26.5%。方法HMFT(hierarchical multi-modal fusion tracker)在所提数据集上的PR与RGBT234相比下降了23.6%,SR下降了14%。此外,利用HiAl数据集对6个方法进行重新训练实验,所有重训练方法的性能均得到提升。结论本文提出一个基于高空无人机平台的多模态目标跟踪数据集,旨在促进多模态目标跟踪在高空无人机上的应用研究。HiAl数据集的在线发布地址为:https://github.com/mmic-lcl/Datasets-and-benchmark-code/tree/main。 展开更多
关键词 多模态目标跟踪 高空无人机 微小目标 高质量配准 数据集
原文传递
基于YOLOv8网络和AI技术的航天电子设备故障诊断方法研究
2
作者 苏亮 田子涵 +2 位作者 徐凯建 张东胜 方舟 《航天器环境工程》 2025年第5期549-556,共8页
焊点失效导致的电路中断是航天电子设备故障的常见原因,而人工智能(AI)技术为实时、精确的故障检测提供了全新技术路径。文章提出一种改进的缺陷检测方法YOLO-KSD,该方法在YOLOv8网络结构基础上,结合自适应的模型优化策略,构建高效的Ker... 焊点失效导致的电路中断是航天电子设备故障的常见原因,而人工智能(AI)技术为实时、精确的故障检测提供了全新技术路径。文章提出一种改进的缺陷检测方法YOLO-KSD,该方法在YOLOv8网络结构基础上,结合自适应的模型优化策略,构建高效的Kernel Warehouse骨干框架,引入轻量化的GSConv+Slim Neck模块以增强特征提取能力,并采用Dynamic Head框架提升检测头的适应性;参考多个公开的焊点和电路板缺陷数据集,并结合实际采集的PCB图像,构建了一个扩充后的缺陷数据集,以训练和验证该AI模型。结果表明,在相同硬件条件下,YOLO-KSD模型显著提升了PCB焊点与电路板缺陷的检测精度,且单帧处理时间缩短约11.1%,可以有效应对多种缺陷类型,对小目标的检测效果提升尤为显著,为航天电子设备焊点类缺陷的检测技术发展奠定了基础。 展开更多
关键词 YOLOv8网络 AI模型优化 数据集构建 缺陷检测 小目标检测
在线阅读 下载PDF
YOLO11-DAE:高分遥感图像露天煤矿复杂场景目标识别方法
3
作者 刘英 范雅慧 岳辉 《地球信息科学学报》 北大核心 2025年第9期2230-2249,共20页
【目的】矿产资源是人类生存和经济发展的重要物质基础,开展矿山监测、建立矿山监测模型对矿产资源的高效开发和矿区环境保护具有重要意义。针对露天矿区背景复杂、目标尺度多样且小目标聚集的特点,本研究旨在构建兼顾监测精度与效率的... 【目的】矿产资源是人类生存和经济发展的重要物质基础,开展矿山监测、建立矿山监测模型对矿产资源的高效开发和矿区环境保护具有重要意义。针对露天矿区背景复杂、目标尺度多样且小目标聚集的特点,本研究旨在构建兼顾监测精度与效率的轻量化模型,以提升矿区目标地物监测的准确性和效率。【方法】现有遥感数据集存在的样本单一、地域局限等问题,因此本文基于0.9 m天地图与1.8 m谷歌影像构建了不同气候背景、大范围和多种地物的六大露天煤矿基地OMTSFD(Open-pit Mine Typical Surface Features Dataset)数据集,提出改进的YOLO11-DAE算法进行模型训练与验证。首先,在骨干网络和特征金字塔中引入C3K2-DBB模块以增强多尺度特征捕获能力;其次,采用ADown模块替换网络下采样卷积,增强了模块对不同特征的表征能力,减少了低对比度场景的细节丢失;最后,采用E_Detect高效检测头降低模型复杂度和参数量,实现模型轻量化。【结果】实验表明,YOLO11-DAE的每秒帧数(Frames Per Second,FPS)为528.100,模型推理速度较快,精确率(Precision,P)、召回率(Recall,R)、综合评价指标(F1-Score,F1)、平均精度均值(Mean Average Precision,mAP)分别达到0.932、0.894、0.913和0.950,显著优于YOLOv5n、YOLOv8n和YOLOv10n算法,相较于YOLOv11n各项指标分别提高7.600%、10.000%、8.800%、8.000%。【结论】YOLO11-DAE算法能够满足矿区实时监测,并适用于多尺度、多背景等复杂场景的目标识别,实现了高精度、低漏检率的监测目标,达到了模型可应用性与实时性的平衡。 展开更多
关键词 矿山监测 目标识别 多尺度特征 矿山地物数据集 YOLO11-DAE 轻量化模型 深度学习
原文传递
基于改进DenseFusion的卫星6D位姿估计方法
4
作者 王金聪 杨海峰 +2 位作者 宋文龙 汤普然 于志超 《激光杂志》 北大核心 2025年第3期161-168,共8页
针对目前在空间环境中光照强烈变化和空间背景复杂多变,以及卫星表面纹理特征稀缺情况下无法准确估计卫星在相机坐标系中的位置和姿态的问题,提出一种结合部分卷积(Partial Convolution,PConv)和大核注意力(large kernel attention,LKA... 针对目前在空间环境中光照强烈变化和空间背景复杂多变,以及卫星表面纹理特征稀缺情况下无法准确估计卫星在相机坐标系中的位置和姿态的问题,提出一种结合部分卷积(Partial Convolution,PConv)和大核注意力(large kernel attention,LKA)的卫星6D位姿估计方法。该方法以DenseFusion网络作为基础框架,首先改进了基于Blender的渲染数据集制作方法并制作了卫星位姿估计仿真数据集;其次,在特征提取网络的编码部分融入部分卷积模块降低对光照变化和背景噪声的敏感性;最后,为了获取不同尺度下纹理特征较弱卫星的特征图,设计一种金字塔场景解析网络LKA-PSPNet(Large Kernel Attention Pyramid Scene Parsing Network)实验结果表明,该算法在LineMod公共数据集和自制卫星仿真数据集上ADD-(S)指标分别达到97.6%和89.2%,与改进前相比,分别提升3.3个百分点和2.9个百分点,验证了改进算法的有效性。 展开更多
关键词 6D位姿估计 航天器智能 深度学习 仿真数据集 空间目标
原文传递
DataReader与DataSet对象之比较分析 被引量:4
5
作者 徐枫 《现代电子技术》 2008年第7期185-187,190,共4页
随着数据库技术在软件开发中的广泛应用,数据库访问技术在管理系统的设计中得到了广大开发人员的重视。通过对ADO.NET中经常用到的DataReader与DataSet数据访问对象的基本属性、方法以及应用环境的深入比较和分析,找出了他们之间的区别... 随着数据库技术在软件开发中的广泛应用,数据库访问技术在管理系统的设计中得到了广大开发人员的重视。通过对ADO.NET中经常用到的DataReader与DataSet数据访问对象的基本属性、方法以及应用环境的深入比较和分析,找出了他们之间的区别,同时给出了他们在实际应用中的程序设计案例,由此得出了DataReader对象适合在连接工作环境下使用,而DataSet对象更适合在非连接工作环境下使用的结论,同时给数据库开发人员提供有益的参考。 展开更多
关键词 ADO.NET 数据访问 DataReader对象 dataset对象
在线阅读 下载PDF
无人机视角多源目标检测数据集UAV-RGBT及算法基准
6
作者 汪进中 戴顺 +5 位作者 张秀伟 田雪涛 邢颖慧 汪芳 尹翰林 张艳宁 《电子学报》 北大核心 2025年第3期686-704,共19页
基于无人机(Unmanned Aerial Vehicle,UAV)平台的可见光(Red Green Blue,RGB)和热红外(Thermal infrared,T)多源目标检测,可实现全天时、全天候的目标侦察,在军用和民用领域有着重要的应用价值.受限于数据拍摄获取和处理的复杂性,当前... 基于无人机(Unmanned Aerial Vehicle,UAV)平台的可见光(Red Green Blue,RGB)和热红外(Thermal infrared,T)多源目标检测,可实现全天时、全天候的目标侦察,在军用和民用领域有着重要的应用价值.受限于数据拍摄获取和处理的复杂性,当前少有公开的UAV视角RGB-T多源目标检测数据集,一定程度上限制了UAV视角RGB-T多源目标检测算法的研究和应用.与此同时,UAV应用场景复杂多变,其飞行高度、速度、焦距和背景等快速变化,所拍摄目标在图像上呈现出尺度多样、稠密/稀疏分布不均衡、类别不平衡等特点,具有一定的挑战性.此外,在诸如目标侦察、交通监控等高时效性应用场景中,算法需在保证高精度的同时实现实时目标检测,因此,算法的设计必须充分考虑精度与速度之间的平衡.针对上述问题,本文构建了一个跨季节、跨昼夜、多类别、多尺度的大规模UAV视角RGB-T多源图像数据集UAV-RGBT,包含20个类别、5117对RGB-T图像和超11万个标注,有助于推进UAV视角多源目标检测算法的研究.同时,基于YOLOv8n模型,本文提出了一种UAV视角多源目标检测(UAV-based Dualbranch Multispectral object Detection,UAV-DMDet)模型,其通过多源交叉注意力融合和多源特征分解组合方法有效促进了多源特征的深度融合,较好地实现了模型参数量、检测速度和检测精度的均衡.实验结果表明:在UAVRGBT数据集上,UAV-DMDet模型较单源YOLOv8n模型,在RGB和T模态方面,mAP@0.5分别提高了3.61%、11.03%,mAP@0.5:0.95分别提高了0.84%、6.76%;在DroneVehicle数据集上,mAP@0.5和mAP@0.5:0.95较主流算法I2MDet提高了2.66%和12.36%;在检测速度方面,以640×640分辨率图像为例,UAV-DMDet模型在单张GeForce RTX 3090显卡上FP32精度推理速度可达31帧/s,在华为昇腾710处理器上FP16精度推理速度可达58帧/s,可有效应用于UAV视角RGB-T多源实时目标检测任务. 展开更多
关键词 无人机(UAV) 可见光-热红外(RGB-T)多源目标检测 数据集 多源特征融合 YOLOv8
在线阅读 下载PDF
基于YOLOv8的油气管道漏磁检测缺陷智能识别技术研究 被引量:1
7
作者 李春晖 吕岩 +2 位作者 孟祥来 李玲慧 蒲晓晨 《仪器仪表学报》 北大核心 2025年第2期247-254,共8页
油气管道漏磁检测是评估管道完整性的重要手段,但传统人工分析方法存在效率低、误判率高等问题,故提出了一种基于YOLOv8深度学习算法的油气管道漏磁检测智能识别方法,实现管道缺陷的自动化检测。研究创新性地构建了一套基于人工标注经... 油气管道漏磁检测是评估管道完整性的重要手段,但传统人工分析方法存在效率低、误判率高等问题,故提出了一种基于YOLOv8深度学习算法的油气管道漏磁检测智能识别方法,实现管道缺陷的自动化检测。研究创新性地构建了一套基于人工标注经验的自动化训练数据集生成方法,有效继承了专家领域知识,显著提升了数据集构建效率。通过对漏磁信号进行预处理和图像增强,将原始数据转换为标准化灰度图像,并采用自适应图像增强策略,有效提升了图像质量和目标特征的可区分性。从实际工程项目中采集并生成36 098张高质量漏磁图像,其中3 403张含缺陷图像用作训练集。缺陷在管道轴向-周向平面上呈现相对均匀分布,在焊缝位置存在局部高密度区域,尺寸主要集中在较小范围内并呈现长尾分布特征,为模型训练提供了扎实的数据基础。训练过程中,模型的精确率P和召回率R指标分别稳定在0.66和0.60,mAP@0.5指标稳定于0.57,而mAP@[0.5∶0.95]达到0.27。在实际工程数据测试中,模型的精确率、召回率和F1分数分别达到63.17%、65.24%和64.19%,验证了YOLOv8模型在管道检测任务中的可行性和优异的检测性能。该方法不仅显著提高了检测效率,降低了人工成本,而且有效避免了人为因素导致的判断偏差。研究结果表明,基于深度学习的智能识别方法在油气管道漏磁检测领域具有广阔的应用前景。 展开更多
关键词 油气管道 漏磁检测 深度学习 YOLOv8 目标检测 数据集
原文传递
面向甲骨文目标检测的大规模数据集生成技术 被引量:1
8
作者 杨富勇 李华飙 孟睿伟 《西北大学学报(自然科学版)》 北大核心 2025年第1期36-49,共14页
甲骨文目标检测是甲骨文数字化研究中重要一环,主要依靠深度学习模型实现对甲骨文图像中位置信息和分类信息的识别。为了避免模型过拟合,深度学习模型的训练一般需要依赖大规模的数据集,而在甲骨文目标检测领域,目前可用于深度学习的大... 甲骨文目标检测是甲骨文数字化研究中重要一环,主要依靠深度学习模型实现对甲骨文图像中位置信息和分类信息的识别。为了避免模型过拟合,深度学习模型的训练一般需要依赖大规模的数据集,而在甲骨文目标检测领域,目前可用于深度学习的大规模数据集较少,很多研究所用的数据集均依靠专家人工标注和整理,这使得甲骨文目标检测数据集存在整理成本较高、数据量较小、数据质量不高、类别间均衡性差等问题。提出了动态两阶段Mosaic算法及甲骨文大规模数据集生成技术,解决传统Mosaic算法在处理甲骨文图像中存在的拼接图数量有限、图像的多样性和差异性不足、空白背景较大、信息缺失等问题,并设计了完整的数据集生成流程,实现了从甲骨文单字符图片到大规模数据集生成的流程化、智能化处理,从根本上解决了甲骨文目标检测领域的数据困境。通过此研究方法,生成了标注位置信息和类别信息且规模庞大的甲骨文数据集,共生成57万张甲骨文图像和57万份对应的标注文件,包含甲骨文类别416类,样本数量最少的类别包含了516个甲骨文字符,且数据集规模和各类别样本数量可动态调整以避免类别间样本不均衡。采用YOLOv8模型对生成后的大规模数据集进行训练,在经过200批次训练后,模型精度(Precision)达到96.45%,mAP50值为97.75%,mAP50-95值为96.96%,从模型训练曲线看,训练过程表现出较好的稳定性和高效性,模型训练结果表明,研究的数据集生成技术可应用于甲骨文目标检测。 展开更多
关键词 甲骨文 深度学习 目标检测 数据集 YOLOv8算法
在线阅读 下载PDF
无人机视角下车辆小目标智能检测算法研究
9
作者 王海玮 蔡耿基 +1 位作者 张为 游峰 《广东交通职业技术学院学报》 2025年第1期57-63,共7页
随着低空经济与无人机技术的快速发展,无人机可作为获取交通信息的新型载具。针对无人机视角下车辆小目标数据集较为稀缺的问题,构建了包括客车、货车和巴士三类的车辆小目标检测数据集。对YOLO系列网络在无人机场景中的适配性进行系统... 随着低空经济与无人机技术的快速发展,无人机可作为获取交通信息的新型载具。针对无人机视角下车辆小目标数据集较为稀缺的问题,构建了包括客车、货车和巴士三类的车辆小目标检测数据集。对YOLO系列网络在无人机场景中的适配性进行系统对比,最终优选YOLOv8网络,作为车辆小目标检测的核心框架。为全面评估算法性能,论文构建了基于准确率、召回率、平均精度均值、Giga浮点运算量及权重文件大小等的多维度评价指标。在此基础上,在YOLOv8m模型上增加了适用于小目标检测的优化层,构建YOLOv8m-p2网络。实验结果表明,YOLOv8m-p2在保持较低运算与存储开销的同时,大幅提升了无人机航拍下车辆小目标的识别精度与实时性,并在小目标捕捉能力与预测准确度方面予以平衡。 展开更多
关键词 无人机 车辆数据集 目标检测 YOLO 低空经济
在线阅读 下载PDF
多光谱目标检测算法及相关数据集综述
10
作者 张天泷 耿远超 +1 位作者 廖予祯 许党朋 《强激光与粒子束》 北大核心 2025年第5期1-18,共18页
相较于单一波段目标检测技术,多光谱目标检测技术通过捕获物体在多个不同波长的光谱波段下的反射或辐射信息,极大地提高目标检测的准确性和应对复杂环境的鲁棒性。在遥感、农业检测、环境保护、工业生产以及国防安全等领域有着广泛的应... 相较于单一波段目标检测技术,多光谱目标检测技术通过捕获物体在多个不同波长的光谱波段下的反射或辐射信息,极大地提高目标检测的准确性和应对复杂环境的鲁棒性。在遥感、农业检测、环境保护、工业生产以及国防安全等领域有着广泛的应用。然而,目前多光谱目标检测领域仍面临着严峻挑战:多样化的高质量数据集以及高效目标检测算法的缺乏,严重制约了该技术的进一步发展和应用。鉴于此,综合阐释了多光谱目标检测数据集的制作方法以及多光谱目标检测算法的重要进展。首先,系统分析了多光谱数据集的构建过程,包括数据采集,预处理和数据标注。其次,全面分析了目标检测算法发展的历史脉络,这些算法涵盖了基于传统特征提取技术的目标检测算法、深度学习方法以及其改进版本。此外,着重强调了算法开发者为提升多光谱目标检测性能在特征融合、模型架构和子网络方面所作的关键改进。最后,探讨了多光谱目标检测技术未来的发展方向,期望为研究人员指明潜在的研究热点和应用领域,促成多光谱目标检测技术在实际场景中更广泛的应用,提升其社会价值。 展开更多
关键词 多光谱成像技术 成像光谱仪 目标检测算法 多光谱目标检测算法 数据集 特征融合
在线阅读 下载PDF
无人机遥感图像目标检测技术研究综述 被引量:1
11
作者 王长龙 冀鲸宇 +2 位作者 赵月飞 林志龙 马晓琳 《陆军工程大学学报》 2025年第1期35-46,共12页
目标检测技术在无人机遥感图像方面具有巨大发展潜力。为了有针对性地设计出适合遥感图像的目标检测算法,需要准确把握当前各类算法的优势及局限,探索新的解决策略。本文对基于传统技术和深度学习的目标检测方法进行了全面系统的分析,... 目标检测技术在无人机遥感图像方面具有巨大发展潜力。为了有针对性地设计出适合遥感图像的目标检测算法,需要准确把握当前各类算法的优势及局限,探索新的解决策略。本文对基于传统技术和深度学习的目标检测方法进行了全面系统的分析,并将各类算法进行了对比;总结了常用的遥感图像数据集及目标检测算法的评价指标;针对遥感图像目标检测中目标较小、含有遮挡物以及背景环境复杂等关键问题,深入剖析了现有方法在处理这些难点时所面临的挑战;鉴于遥感图像的背景环境以及特性,从5个方面探讨了当前算法可能的改进方向,为无人机遥感图像目标检测技术的发展提供了参考。 展开更多
关键词 无人机遥感图像 目标检测 数据集 评价指标
在线阅读 下载PDF
基于YOLOV网络的隧道火灾检测与应用
12
作者 王向前 孟修建 +2 位作者 梁浩翔 文雅 宋焕生 《微型电脑应用》 2025年第4期1-3,7,共4页
隧道火灾会引起交通中断,严重时会危及人员、财产与隧道结构的安全。目前的火灾检测算法不能对隧道监控视野中存在车灯闪烁等干扰情况时进行有效检测,对此,提出一个隧道火灾视频目标检测数据集,并采用联合多帧检测的YOLOV网络得到火灾... 隧道火灾会引起交通中断,严重时会危及人员、财产与隧道结构的安全。目前的火灾检测算法不能对隧道监控视野中存在车灯闪烁等干扰情况时进行有效检测,对此,提出一个隧道火灾视频目标检测数据集,并采用联合多帧检测的YOLOV网络得到火灾检测结果,对结果进行火焰烟雾面积变化率的统计,降低火灾的误报,提升检测结果的可靠性。在多种隧道实际火灾视频中的测试表明,所提方法达到了90.53%的平均检测精度与26.75 f/s的检测速度,能够识别距离摄像机较远的火焰、区分多种类别灯光的干扰,具有较高的检测可靠性与实际应用价值。 展开更多
关键词 高速公路隧道 隧道火灾检测 火灾检测数据集 深度网络 视频目标检测
在线阅读 下载PDF
基于窗口注意力机制的端到端目标检测算法
13
作者 李彪 陈春雨 《应用科技》 2025年第1期181-188,共8页
Transformer目标检测模型在小目标检测性能和训练收敛速度方面存在不足。为了解决这些问题,本文设计了一种多尺度窗口注意力机制,将其应用于检测变换器(detection Transformer,DETR)的Transformer中。这种机制为注意力计算引入了局部信... Transformer目标检测模型在小目标检测性能和训练收敛速度方面存在不足。为了解决这些问题,本文设计了一种多尺度窗口注意力机制,将其应用于检测变换器(detection Transformer,DETR)的Transformer中。这种机制为注意力计算引入了局部信息,有助于提取局部小目标的信息,并且降低了计算复杂度,使得DETR能够处理更高分辨率的特征图。本文提出的Windows DETR在COCO 2017数据集上取得了比DETR更优的性能,特别是在小目标检测方面,平均精度(average precision,AP)提升了3.2;同时,Windows DETR还加快了模型的训练收敛速度。 展开更多
关键词 深度学习 目标检测 检测变换器 TRANSFORMER 窗口注意力机制 多尺度 小目标 COCO2017数据集
在线阅读 下载PDF
地铁车辆附着异物的数据集扩充方法和检测模型随机mixup训练方法研究(下)
14
作者 黎志国 《铁道技术监督》 2025年第3期61-65,共5页
现有的地铁车辆异物检测模型存在真实训练数据匮乏、检测精度低等问题,难以满足实际应用的需要。对此,从公开数据集和互联网中收集废弃塑料袋等异物图像并标注异物轮廓,利用随机旋转、缩放等方法扩展图像数据,利用泊松融合算法,将异物... 现有的地铁车辆异物检测模型存在真实训练数据匮乏、检测精度低等问题,难以满足实际应用的需要。对此,从公开数据集和互联网中收集废弃塑料袋等异物图像并标注异物轮廓,利用随机旋转、缩放等方法扩展图像数据,利用泊松融合算法,将异物图像与可能附着异物的图像随机融合,生成附着异物图像数据集。采用随机mixup方法,利用扩充后的数据集,训练基于YOLOv4网络的地铁车辆附着异物检测模型,并开展验证试验。试验结果表明,利用扩充后的异物数据集,采用随机mixup方法训练后的检测模型,检测效果更佳。 展开更多
关键词 地铁车辆 附着异物 图像识别 深度卷积神经网络 目标检测 数据集 模型训练 训练方法
在线阅读 下载PDF
基于深度学习的伪装目标检测研究进展
15
作者 张冬冬 王春平 +1 位作者 付强 王慧赢 《火力与指挥控制》 北大核心 2025年第2期1-12,20,共13页
伪装目标检测是一个新兴的研究方向,在计算机视觉领域引发了广泛关注。现有大多数工作以构建高效的检测模型为目的,缺少对已有模型的深入分析及归纳总结。因此,对现有基于深度学习的伪装目标检测模型进行全面分析和总结,并探讨伪装目标... 伪装目标检测是一个新兴的研究方向,在计算机视觉领域引发了广泛关注。现有大多数工作以构建高效的检测模型为目的,缺少对已有模型的深入分析及归纳总结。因此,对现有基于深度学习的伪装目标检测模型进行全面分析和总结,并探讨伪装目标检测潜在的研究方向。对基于深度学习的已存模型进行全面综述,并详细阐述相关模型的原理和优劣势;介绍伪装目标检测领域常用数据集及评价指标;对现有基于深度学习的伪装目标检测模型进行复现,并对不同类型模型在公开数据集上的检测结果进行定性和定量比较;对伪装目标检测领域的未来研究方向进行展望。 展开更多
关键词 伪装目标检测 深度学习 数据集 评价指标
在线阅读 下载PDF
RMT-YOLOv8s:一种基于改进YOLOv8s的高精度车辆检测模型
16
作者 吴锡铭 《长江信息通信》 2025年第1期9-12,15,共5页
针对复杂交通监控场景下现有方法在车辆检测任务上检测精度差的问题,文章提出一种基于改进YOLOv8s模型的高精度车辆检测方法RMT-YOLOv8s,使用RMT替换YOLOv8s的骨干特征提取网络,增强模型对复杂场景图像的特征提取与表示能力;在特征融合... 针对复杂交通监控场景下现有方法在车辆检测任务上检测精度差的问题,文章提出一种基于改进YOLOv8s模型的高精度车辆检测方法RMT-YOLOv8s,使用RMT替换YOLOv8s的骨干特征提取网络,增强模型对复杂场景图像的特征提取与表示能力;在特征融合和增强阶段引入混合域注意力方法CPCA,利用视觉注意力机制CPCA分层细粒度地提取与增强车辆特征,增强模型的特征融合和增强能力。在UA-DETRAC数据集的实验结果表明,RMT-YOLOv8s在准确率、召回率、mAP@0.5以及mAP@0.5:0.95指标分别能达到98.1%、98.0%、98.9%和93.8%,相较于基准的YOLOv8s模型,其四个指标分别涨点1.9%、2.7%、1.5%和3.0%,有效增强了模型在不同场景下的车辆目标检测能力。 展开更多
关键词 深度学习 目标检测 数据集 YOLOv8
在线阅读 下载PDF
地铁车辆附着异物的数据集扩充方法和检测模型随机mixup训练方法研究(上)
17
作者 黎志国 《铁道技术监督》 2025年第2期59-62,共4页
现有的地铁车辆异物检测模型存在真实训练数据匮乏、检测精度低等问题,难以满足实际应用的需要。对此,从公开数据集和互联网中收集废弃塑料袋等异物图像并标注异物轮廓,利用随机旋转、缩放等方法扩展图像数据,利用泊松融合算法,将异物... 现有的地铁车辆异物检测模型存在真实训练数据匮乏、检测精度低等问题,难以满足实际应用的需要。对此,从公开数据集和互联网中收集废弃塑料袋等异物图像并标注异物轮廓,利用随机旋转、缩放等方法扩展图像数据,利用泊松融合算法,将异物图像与可能附着异物的图像随机融合,生成附着异物图像数据集。采用随机mixup方法,利用扩充后的数据集,训练基于YOLOv4网络的地铁车辆附着异物检测模型,并开展验证试验。试验结果表明,利用扩充后的异物数据集,采用随机mixup方法训练后的检测模型,检测效果更佳。 展开更多
关键词 地铁车辆 附着异物 图像识别 深度卷积神经网络 目标检测 数据集 模型训练 训练方法
在线阅读 下载PDF
复杂交互场景下融合关节遮挡信息的手部姿态估计研究
18
作者 李少东 罗凯 +3 位作者 黄远智 刘熹 双丰 高放 《计算机学报》 北大核心 2025年第5期1212-1231,共20页
基于视觉的手部姿态估计是计算机视觉领域的研究热点,也是理解人类交互意图的重要途径。手部在交互中不可避免会被自身或物体遮挡造成关键信息丢失,不仅影响遮挡域手部姿态估计精度,也会降低可见域手部姿态估计精度。由于现有公开数据... 基于视觉的手部姿态估计是计算机视觉领域的研究热点,也是理解人类交互意图的重要途径。手部在交互中不可避免会被自身或物体遮挡造成关键信息丢失,不仅影响遮挡域手部姿态估计精度,也会降低可见域手部姿态估计精度。由于现有公开数据集缺乏大规模遮挡标签,导致专注于解决遮挡问题的研究成果不足。受此启发,本文旨在通过分类手部遮挡关节,提高遮挡下手部姿态估计精度。面向复杂交互场景,以手部MANO模型和拓扑结构为基础,将手部分割为独立运动单元集合,并基于相机成像原理首次提出单手、双手和手物交互下关节遮挡判别器,能够为公开数据集制作遮挡标签。为了表明抑制遮挡关节对提高手部姿态估计精度的重要性,本文融合关节遮挡与可见性提出动态特征选择模块,并且级联于重要研究成果POEM网络上,提出了融合关节遮挡信息的手部姿态估计网络。此外,本文基于增强现实建立了具有交互意图的手部遮挡数据集HODA,在虚拟物体引导下完成预抓取和抓取运动,既能实时反馈真实操作状态,又有效地避免物体遮挡影响。为了丰富数据集,本文采用文本引导的扩散模型为手部图像生成自然且连贯的背景。在实验环节,通过7个公开数据集和HODA验证了关节遮挡分类方法的准确率超过95.07%;基于遮挡关节数量统计将3个数据集划分为无遮挡、轻微遮挡和重度遮挡,以此验证遮挡数量对手部姿态估计的不利影响;利用对比实验和权重矩阵消融实验验证了融合关节遮挡信息的手部姿态估计网络在DexYCB、HanCo和HO3D数据集上达到了先进水平;基于泛化性、相似性实验以及扩充数据集实验验证了HODA数据集的有效性。 展开更多
关键词 关节遮挡分类 手部姿态估计 自遮挡 双手遮挡 物体遮挡 手部数据集 扩散模型
在线阅读 下载PDF
基于Python的YOLO数据集管理软件设计与实证研究
19
作者 林静敏 魏松林 《乐山师范学院学报》 2025年第4期23-32,共10页
随着YOLO目标检测技术的广泛应用,多源数据集的标签定制与高效融合成为提升模型训练效率的关键挑战。现有工具存在标注分散、格式转换繁琐、缺乏统一管理平台等问题,导致数据准备效率低且易出错。为此,文章通过集成多源数据集格式转换... 随着YOLO目标检测技术的广泛应用,多源数据集的标签定制与高效融合成为提升模型训练效率的关键挑战。现有工具存在标注分散、格式转换繁琐、缺乏统一管理平台等问题,导致数据准备效率低且易出错。为此,文章通过集成多源数据集格式转换、标签动态映射、子集划分及合并等核心功能,支持用户通过配置文件灵活定制标签,拟设计一款基于Python的YOLO数据集管理软件,以解决标签命名冲突与类别冗余等问题。实证结果表明,该软件在融合4个异构数据集(15.8万张图像)时,内存占用仅99.8 MB,平均每生成一个标注文件约耗时12.74 ms,验证了其在复杂场景与大规模数据下的高效性;该软件支持跨平台运行,为YOLO算法开发者提供了一套轻量化、可扩展的工具,成功实现了多源数据集标签定制与融合,对推动目标检测技术的工程化应用具有实践价值。 展开更多
关键词 目标检测 YOLO数据集管理 数据集融合 标签定制
在线阅读 下载PDF
基于YOLOv11n的自动驾驶目标检测研究
20
作者 徐俊杰 张亚鹏 罗维平 《金陵科技学院学报》 2025年第2期26-32,共7页
针对自动驾驶场景中目标检测存在的小目标漏检以及对复杂环境适应性差的问题,采用了轻量级目标检测模型YOLOv11n。该模型使用Transformer作为骨干网络提高全局特征的提取能力,引入C3k2模块增强局部特征的表达能力,集成SPPF模块融合不同... 针对自动驾驶场景中目标检测存在的小目标漏检以及对复杂环境适应性差的问题,采用了轻量级目标检测模型YOLOv11n。该模型使用Transformer作为骨干网络提高全局特征的提取能力,引入C3k2模块增强局部特征的表达能力,集成SPPF模块融合不同尺度的特征信息,结合跨阶段部分连接(CSPC)和金字塔挤压注意力(PSA)机制设计C2PSA模块,使得YOLOv11n模型能够更精确地聚焦关键区域。在KITTI数据集上的实验结果显示,YOLOv11n模型的精确度(P)、召回率(R)和平均精度(AP)均有所提高,其中车辆检测精度达到94.0%,提升了复杂场景下的检测能力,减少了小目标漏检率,为自动驾驶技术的实际应用提供了更高效可靠的解决办法。 展开更多
关键词 自动驾驶 目标检测 YOLOv11n TRANSFORMER KITTI数据集
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部