期刊文献+
共找到218,593篇文章
< 1 2 250 >
每页显示 20 50 100
基于多尺度特征增强的航拍小目标检测算法
1
作者 肖剑 何昕泽 +2 位作者 程鸿亮 杨小苑 胡欣 《浙江大学学报(工学版)》 北大核心 2026年第1期19-31,共13页
针对航拍图像小目标检测中存在的检测精度低和模型参数量大的问题,提出兼顾性能与资源消耗的航拍小目标检测算法.以YOLOv8s为基准网络,通过降低通道维数和加强对高频特征的关注,提出自适应细节增强模块(ADEM),在减少冗余信息的同时加强... 针对航拍图像小目标检测中存在的检测精度低和模型参数量大的问题,提出兼顾性能与资源消耗的航拍小目标检测算法.以YOLOv8s为基准网络,通过降低通道维数和加强对高频特征的关注,提出自适应细节增强模块(ADEM),在减少冗余信息的同时加强对小目标细粒度特征的捕获;基于PAN-FPN架构调整特征融合网络,增加对浅层特征的关注,同时引入多尺度卷积核增强对目标上下文信息的关注,以适应小目标检测场景;针对传统IoU灵活性、泛化性不强的问题,构建参数可调的Nin-IoU,通过引入可调参数,实现对IoU的针对性调整,以适应不同检测任务的需求;提出轻量化检测头,在增强多尺度特征信息交融的同时减少冗余信息的传递.结果表明,在VisDrone2019数据集上,所提算法以8.08×106的参数量实现了mAP0.5=50.3%的检测精度;相较于基准算法YOLOv8s,参数量降低了27.4%,精度提升了11.5个百分点.在DOTA与DIOR数据集上的实验结果表明,所提算法具有较强的泛化能力. 展开更多
关键词 目标检测 YOLOv8 无人机图像 特征融合 损失函数
在线阅读 下载PDF
重构YOLOv11的无人机小目标检测算法
2
作者 孟昱煜 孔垂乐 +1 位作者 火久元 武泽宇 《浙江大学学报(工学版)》 北大核心 2026年第2期303-312,331,共11页
无人机视角下目标偏小、背景复杂、场景包含多尺度信息,现有算法在小目标检测中特征提取不充分、检测效果不佳,为此提出面向多尺度复杂场景、无人机视角下基于重构YOLOv11的小目标检测算法DLSRF-Net.提出自适应深度可分离感受野注意力... 无人机视角下目标偏小、背景复杂、场景包含多尺度信息,现有算法在小目标检测中特征提取不充分、检测效果不佳,为此提出面向多尺度复杂场景、无人机视角下基于重构YOLOv11的小目标检测算法DLSRF-Net.提出自适应深度可分离感受野注意力卷积模块(DSRFAConv),提升模型对小目标感受野特征的提取能力并降低模型负载;设计多分支轻量化多尺度线性注意力机制,提升模型对小目标的关注度;设计RSCDI模块作为模型的上采样层和全连接层,解决特征信息丢失问题并抑制无用信息,提升模型的检测精度.按照参数量和计算量将模型尺寸分为2类,并在VisDrone2021数据集上进行实验验证,结果表明,所提算法在2类模型尺寸下均取得了最优性能.在DOTA和SSDD数据集上验证了所提算法的泛化能力. 展开更多
关键词 小目标检测 复杂场景 YOLOv11 多尺度线性注意力 RSCDI
在线阅读 下载PDF
多模态特征交互与语义引导融合的RGB-T人群计数
3
作者 陈永 张娇娇 董珂 《北京航空航天大学学报》 北大核心 2026年第1期28-37,共10页
RGB-T模态人群计数旨在利用可见光RGB和热红外图像的互补性实现人群计数。针对RGB-T多模态人群计数方法在特征提取时,存在模态间信息交互不足、特征融合不充分,导致人群计数结果不准确的问题,提出了一种多模态特征交互与语义引导融合的R... RGB-T模态人群计数旨在利用可见光RGB和热红外图像的互补性实现人群计数。针对RGB-T多模态人群计数方法在特征提取时,存在模态间信息交互不足、特征融合不充分,导致人群计数结果不准确的问题,提出了一种多模态特征交互与语义引导融合的RGB-T人群计数方法。设计堆叠小尺度卷积核作为主干网络分支,提取各单模态的粗特征;提出多模态特征交互模块,对RGB和热红外各模态进行特征精细提取,实现模态间信息交互,克服信息交互不足的缺点;设计语义引导融合模块,通过全局与局部特征引导融合,增强多模态人群特征语义相关性,以充分融合多元上下文信息,提高人群目标的识别能力;利用回归头生成人群密度图,并输出计数结果。实验结果表明:所提方法在公开RGBT-CC数据集上各评价指标均优于对比方法,相较于CMCRL方法,所提方法的均方根误差降低了31.12%,对不同场景下人群计数具有更高的准确率。 展开更多
关键词 深度学习 RGB-T 人群计数 多模态特征交互 语义引导融合
原文传递
基于跨模态多头注意力的交通量音视融合检测方法
4
作者 马庆禄 吴斐斐 +2 位作者 吴跃川 张丽 张埂 《重庆交通大学学报(自然科学版)》 北大核心 2026年第1期95-105,共11页
针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征... 针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征并进行高效融合。首先,采用Res2Net网络与DCNv3网络对音视频数据进行特征提取,通过双向长短期记忆网络对时间序列特征处理,分别分析了音视频中复杂行为序列,获取丰富性和连贯性的交通信息描述;其次,在跨模态融合中将交叉注意力与多头注意力结合,利用多个子空间进行合并输出,进行多头注意力跨模态融合;最后,将交叉熵损失和一致性损失联合应用,加强对不同模态信息的协调解析,确保多模态数据在分类和识别任务中的一致性表现。实验结果表明在交通量检测场景下笔者方法分别比单一音频、视频与AVSS(audio-visual speech separation,AVSS)中的融合方法的平均车辆检测准确率提高了2.57%、1.70%、0.95%,车辆平均分类准确率分别提高了4.72%、1.78%、1.62%,总体交通量平均检测准确率分别提高了4.41%、2.96%、1.46%,且在4种不同场景下表现稳定。 展开更多
关键词 交通工程 交通量检测 音视融合 跨模态 注意力机制
在线阅读 下载PDF
基于改进YOLOv8的森林火灾检测方法研究
5
作者 雷建云 田祚汉 +1 位作者 夏梦 雷瑞璠 《中南民族大学学报(自然科学版)》 2026年第1期97-105,共9页
针对森林火灾检测对实时性要求较高的问题,提出了一种基于改进YOLOv8的森林火灾检测方法 .在YOLOv8的基础上,采用轻量化特征提取网络EfficientNet优化YOLOv8原主干网络CSPDarknet53,以减少计算量并提高模型的收敛速度,进而提高火灾检测... 针对森林火灾检测对实时性要求较高的问题,提出了一种基于改进YOLOv8的森林火灾检测方法 .在YOLOv8的基础上,采用轻量化特征提取网络EfficientNet优化YOLOv8原主干网络CSPDarknet53,以减少计算量并提高模型的收敛速度,进而提高火灾检测速度.此外,融入了SENet注意力机制模块,以增强网络对火灾检测的准确性.使用α-IoU损失函数代替YOLOv8原始损失函数中的CIoU损失函数来计算定位损失,该函数能够自适应地调整IoU的阈值,更好地处理不同大小和形状的目标,同时提高模型对小目标的检测性能.结果表明:该方法的平均准确率(mA@0.5P)达到了87.2%,帧率(FPS)提升了17帧,显著提高了火灾检测的实时性. 展开更多
关键词 深度学习 YOLOv8模型 森林火灾检测 实时性
在线阅读 下载PDF
基于改进YOLOv7的输电线路外破隐患检测算法
6
作者 孟军英 杨佳莉 +2 位作者 王建超 赵晓东 苏鹤 《软件导刊》 2026年第1期142-148,共7页
针对现有输电线路外破隐患检测模型存在的检测精度、实时性较差等问题,提出一种基于YOLOv7的输电线路外破隐患目标检测算法。首先,使用特征提取网络UniRepLKNet模块替换Backbone的E-ELAN模块,增大感受野、实现模型轻量化;其次,在Backbon... 针对现有输电线路外破隐患检测模型存在的检测精度、实时性较差等问题,提出一种基于YOLOv7的输电线路外破隐患目标检测算法。首先,使用特征提取网络UniRepLKNet模块替换Backbone的E-ELAN模块,增大感受野、实现模型轻量化;其次,在Backbone后增加多尺度轴向注意力机制(MCA),使改进后的模型能全局识别目标区域的模糊边界;最后,结合归一化损失函数(NWD)与CIoU作为定位回归损失函数,在不下降中大型目标检测精度的同时提升小目标检测精度。实验表明,所提方法在输电线路外破隐患目标识别中的物体总类别平均检测精度为94%,相较于YOLOv7算法提升3.2%,模型参数量、大小分别减少15.8%、15.4%,有利于部署到输电线路系统中。 展开更多
关键词 目标检测 输电线路 YOLOv7 轻量化
在线阅读 下载PDF
基于双视角球面拟合的轻型货车外廓尺寸测量方法研究
7
作者 李冰 王艳芳 《机械设计与制造工程》 2026年第1期87-92,共6页
提出了基于双视角球面拟合与车厢几何约束相结合的轻型货车外廓尺寸测量方法。该方法利用Kinect V2深度相机,从车辆正后方及正侧方两个视角采集货车点云数据,同时获取位于两视角交界处的标靶球点云信息,通过对标靶球点云进行球面拟合,... 提出了基于双视角球面拟合与车厢几何约束相结合的轻型货车外廓尺寸测量方法。该方法利用Kinect V2深度相机,从车辆正后方及正侧方两个视角采集货车点云数据,同时获取位于两视角交界处的标靶球点云信息,通过对标靶球点云进行球面拟合,计算其平移向量,并结合货车车厢的几何约束,实现点云的旋转拼接。随后,采用平面分割与镜像对称方法对车辆进行三维模型构建,准确检测车辆的长度、宽度和高度尺寸。针对车辆未水平停放导致相机坐标系下的车体点云倾斜问题,引入截面切片分析方法,有效减少了宽度测量误差。实验结果表明,通过该方法得到的车辆外廓尺寸,宽度和高度与实际值的误差均不超过±1.0%,长度误差不超过±2.5%。 展开更多
关键词 双目视觉 球面拟合 外廓尺寸测量 随机抽样一致算法
在线阅读 下载PDF
基于关键帧图像特征的视频分类研究
8
作者 张建光 李永霞 刘浩泽 《衡水学院学报》 2026年第1期7-12,共6页
针对视频分类问题,首先对视频进行灰度化、高斯去噪和边缘检测处理,然后提取关键帧,接着对选择的关键帧进行图像特征提取,最后进行语义分类。为了增加关键帧的语义完整性,进一步提出了基于关键帧融合的方法,该方法可以有效避免背景关键... 针对视频分类问题,首先对视频进行灰度化、高斯去噪和边缘检测处理,然后提取关键帧,接着对选择的关键帧进行图像特征提取,最后进行语义分类。为了增加关键帧的语义完整性,进一步提出了基于关键帧融合的方法,该方法可以有效避免背景关键帧被选择。为了验证方法的有效性,利用C3D进行深度视频特征提取,同时利用HOG、InceptionV3和ViT分别对关键帧进行传统图像特征和深度图像特征提取,并使用KNN分类器进行数据分类。在KTH和UCF11两个数据集上开展实验,实验结果表明,所提出的方法可以使视频帧更有效地表示视频的语义内容,提高了视频分类任务的准确性,降低了空间需求。 展开更多
关键词 视频分类 图像特征 关键帧
在线阅读 下载PDF
基于YOLOv8s多阶段算法的幼猪吮乳行为识别研究
9
作者 陈创业 刘兹豪 +4 位作者 胡天让 谢晓丽 李洋 陈立涛 刘根新 《农机化研究》 北大核心 2026年第3期185-193,共9页
针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助De... 针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助DeepSORT算法来实行跨帧目标追踪并分配唯一标识;然后,把多张连续检测图片输入到LSTM模型里进行时序建模,从而判定出该段时间范围内的幼猪是否正在吮乳。于养殖场的母猪产房拍摄了26 320张照片、采集了4 930组行为序列数据集进行试验,结果表明,在mAP@0.5评价标准下,以YOLOv8s模型为基准的目标检测准确率为91.7%,召回率为92.3%,系统整体追踪准确值(MOTA)达到85.6%,且系统可在复杂的养殖环境下做到稳定运行。将该系统布置到云端平台上,可进行云端处理、数据可视化和远程监控等功能,即时展示每头幼猪的吮乳次数和时长,快速找出进食异常的幼猪个体,优化管理效率。 展开更多
关键词 幼猪行为识别 目标检测 多目标跟踪 时序模型 吮乳监测 智能养殖
在线阅读 下载PDF
基于深度霍夫投票的建筑点云轻量级表面重建
10
作者 陈佳舟 朱肖航 +5 位作者 徐阳辉 高崟 鲁一慧 毛真 李胜龙 章超权 《浙江大学学报(工学版)》 北大核心 2026年第2期341-350,共10页
针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难... 针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难的问题,使用深度霍夫投票预测建筑平面,采用基于面的非极大值抑制算法(F-NMS)有效去除预测的重复面以及错误面.设计建筑平面相邻关系预测模块,对经过非极大值抑制后的建筑平面进行相邻关系的预测.定量实验结果表明,与如PolyFit的传统方法相比,所提方法在拟合精度与场景适应性方面均具有显著优势.使用所提方法重建的建筑多边形网格模型保留了输入建筑点云的主要结构特征,存储量不到原始点云的1%. 展开更多
关键词 三维点云 建筑简化 三维重建 霍夫投票 网格模型
在线阅读 下载PDF
通道注意力指导全局-局部语义协同的表情识别
11
作者 吕景刚 高硕 +1 位作者 李玉芝 周金 《计算机科学》 北大核心 2026年第1期195-205,共11页
情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通... 情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通道注意力策略,并结合全局和局部特征的协同机制来提升识别性能。首先,提出了一种抗噪数据增强策略,通过随机高斯模糊、透视变换和色彩扰动等抗噪预处理技术,结合图像拼接、随机翻转和旋转,在保留原始表情的细微特征的同时,提升图像清晰度并丰富数据集多样性和模型在细微情感识别中的鲁棒性。然后,设计了自适应分组排序的通道注意力模块(Channel Attention Module with Adaptive Channel Reordering,CAM-ACR),根据通道注意力函数对通道特征进行重排序,再经分组卷积和拼接获取包含多维度语义信息的局部特征。其次,在局部-全局特征增强机制中,利用局部特征指导优化全局特征的提取,增强全局特征对复杂情感模式和上下文信息的表征能力。最后,将局部特征与全局特征输入改进的交叉注意力融合模块,实现全局与局部特征之间的双向引导与协同增强。实验结果表明,所提方法在RAF-DB,CK+,FER2013和FER2013PLUS数据集上准确率分别达到91.21%,98.31%,74.54%和86.74%,在RAF-DB上学习效率和收敛稳定性均有优势^(1)。 展开更多
关键词 表情识别 局部特征 全局特征 注意力机制 噪声对抗
在线阅读 下载PDF
用于鱼眼图像自适应矫正的注意力金字塔网络
12
作者 张博 李雪 +4 位作者 王白阳 李光健 王国平 潘杨 朱磊 《电光与控制》 北大核心 2026年第1期106-111,共6页
针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增... 针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增强空间金字塔(AASP)模块以加强特征提取;其次,考虑到不同区域的畸变程度差异,在失真矫正阶段引入可变形卷积,以自适应处理不同程度的畸变;最后,为解决失真矫正过程中信息细节丢失导致的图像模糊问题,在编码阶段嵌入SimAM注意力机制,以专注图像关键区域。仿真结果表明:APFC-Net在Place 2数据集上优于MLC和SimFIR等方法;相较于PCN方法,其PSNR和SSIM分别提升9.11%和27.14%,验证了模型在图像矫正中的有效性。 展开更多
关键词 鱼眼图像 畸变矫正 机器视觉 深度学习
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
13
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于深度学习的双域信息CT金属伪影抑制方法
14
作者 海潮 田鑫 +4 位作者 张宏 谭大龙 何一新 孟凡勇 杨民 《北京航空航天大学学报》 北大核心 2026年第1期232-243,共12页
当CT扫描视野中出现金属时,重建图像不可避免地会产生金属伪影,严重影响图像质量。为了抑制金属伪影,提出一种新的深度学习CT金属伪影抑制(MAR)方法,结合正弦图域和图像域的双域信息,采用自适应最优阈值分割方法分割CT图像中的金属,并... 当CT扫描视野中出现金属时,重建图像不可避免地会产生金属伪影,严重影响图像质量。为了抑制金属伪影,提出一种新的深度学习CT金属伪影抑制(MAR)方法,结合正弦图域和图像域的双域信息,采用自适应最优阈值分割方法分割CT图像中的金属,并在正弦图中去除金属污染区域,使用线性插值(LI)初步修复缺失的金属区域,采用正弦图修补网络修复受金属污染的正弦图,利用编码器-解码器网络结构恢复缺失的图像信息。网络输出的正弦图经过滤波反投影(FBP)算法生成CT重建图像。对于初步校正后存在的正弦图信息不一致性问题,使用非局部细化网络在图像域进行修复,减少二次伪影产生。模拟和真实数据实验结果表明:所提方法能有效减少金属伪影,同时保留图像细节信息,显著提高重建图像质量。 展开更多
关键词 图像处理 深度学习 金属伪影抑制 双域信息 Pix2Pix 非局部细化网络
原文传递
基于轻量化SuperPoint网络的水下光学图像特征提取
15
作者 刘艳 朱昌盛 +1 位作者 余彬 霍冠英 《河海大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意... 针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意力融合模块,融合频域与空间域的特征信息,提升网络在水下退化图像中的特征提取能力;构建残差特征增强深度可分离卷积模块,以降低模型复杂度并增强网络的特征提取能力。验证结果表明:该网络较SuperPoint网络参数量减少了13.8%,计算量降低了8.0%,帧率提升31.7%,光照变化和视角变化下的重复率分别提高了2.3%和2.1%,在SQUID和FLSea数据集上的特征点检测与匹配性能评估中具有较好的特征提取鲁棒性。 展开更多
关键词 水下光学图像 SuperPoint网络 轻量化网络 特征提取 特征融合
在线阅读 下载PDF
基于改进RT-DETR的有遮挡交通标志检测算法
16
作者 于天河 杨壮壮 +2 位作者 胡金帅 常梦瑶 王文龙 《工程科学学报》 北大核心 2026年第2期393-408,共16页
针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏... 针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏,自建一个遮挡条件下的交通标志数据集.然后,在反向残差移动块中引入膨胀重参数块,构建了一个轻量级的复合膨胀残差块来替换原始主干提取网络中的BasicBlock,增强了模型的特征提取能力.最后,对RT-DETR模型的损失函数进行了优化,提出了DS-IoU联合损失函数加快收模型敛速度.实验结果表明,改进后的算法在自制数据集上的m AP为94.2%,相比于原始算法增加量为4.7%,在公开数据集TT100K和CCTSDB2021的m AP分别为92.8%和91.7%,相比于原始算法增加量分别为3.1%和2.4%,Params和GFLOPs相比于原始的算法分别降低了26.0%和12.5%.本文提出的改进方法极大地减少了计算量和参数数量,有效提升了遮挡情况下的交通标志的检测精度. 展开更多
关键词 交通标志检测 RT-DETR 遮挡数据集 轻量化 联合损失函数
在线阅读 下载PDF
频域空间信息驱动的特征聚合跨模态行人重识别方法
17
作者 金静 朱传斌 翟凤文 《计算机应用研究》 北大核心 2026年第1期298-304,共7页
跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信... 跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信息且忽略了不同尺度特征语义关联性,提出一种基于频域空间信息的特征聚合(FDSIFA)网络。首先,通过设计的多分支频域空间感知模块(MFSPM),对不同模态的增强图像和原始图像充分提取模态特定信息,同时在频域和空间维度上挖掘跨模态特征的一致性,有效减小了模态间的差异;其次,设计了多阶段特征聚合模块(MFAM),自适应聚合不同尺度的特征,挖掘低层次特征与高层次特征之间的语义关联,提升特征的语义表达能力和判别力。该网络在SYSU-MM01数据集的全搜索模式下,rank-1和mAP分别达到了75.09%和71.35%,优于对比方法,实验结果验证了所提方法的有效性。 展开更多
关键词 跨模态 行人重识别 数据增强 频域空间信息 特征聚合
在线阅读 下载PDF
基于深度学习的无人机单目标跟踪综述
18
作者 陈泷 石磊 +2 位作者 黎智辉 丁锰 潘亦伦 《计算机科学与探索》 北大核心 2026年第1期40-65,共26页
基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网... 基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网络架构特点,将基于深度学习的无人机单目标跟踪方法系统梳理为传统Siamese网络、CNN-Transformer混合架构和全Transformer三大技术路线,重点关注2022—2025年间的最新研究进展。创新性地提出了两个细化分类框架:针对CNN-Transformer混合架构提出模块替代、特征后融合和协同建模三分类;针对Transformer单流方法提出静态计算、混合机制和动态计算三分类。系统揭示了无人机单目标跟踪算法从追求性能最大化向性能与效率协同优化的演进趋势。通过在UAV123、DTB70、UAVDT、VisDrone2018等主流数据集上的性能对比分析,验证了不同技术路线的优势与局限性。识别当前技术面临的关键挑战并提出未来发展方向和工程部署指导。 展开更多
关键词 无人机 单目标跟踪 深度学习 Siamese网络 TRANSFORMER
在线阅读 下载PDF
DarkTiny-YOLO:低光照场景下无人机航拍小目标检测算法
19
作者 赵森 赵健康 +1 位作者 龙海辉 刘传奇 《电光与控制》 北大核心 2026年第2期20-26,34,共8页
针对无人机在低光照场景下航拍任务中目标检测面临的光照不足、目标尺寸小以及背景复杂等挑战,提出了基于YOLOv11s的改进模型DarkTiny-YOLO。该模型首先通过轻量化自校正亮度增强模块(Li-SCBM)动态调整图像亮度,增强目标特征表达;其次,... 针对无人机在低光照场景下航拍任务中目标检测面临的光照不足、目标尺寸小以及背景复杂等挑战,提出了基于YOLOv11s的改进模型DarkTiny-YOLO。该模型首先通过轻量化自校正亮度增强模块(Li-SCBM)动态调整图像亮度,增强目标特征表达;其次,利用轻量化特征金字塔网络(Tiny-FPN),通过引入上下文锚点注意力机制和优化C3k2模块,降低计算成本的同时提高检测精度;最后,采用优化的多尺度小目标动态检测头(MSD-ODHead),加强小目标的识别能力并提升模型在多尺度场景下的检测性能。实验结果表明,DarkTiny-YOLO在VisDrone2019数据集上,相比YOLOv11s算法,mAP指标提升超过0.1,对低光照场景下的小目标检测性能显著提高。 展开更多
关键词 小目标检测 低光照场景 无人机航拍 YOLOv11s
在线阅读 下载PDF
基于改进YOLOv5s的绝缘子缺陷检测方法
20
作者 彭晏飞 袁晓龙 +1 位作者 赵涛 陈炎康 《高压电器》 北大核心 2026年第1期134-142,共9页
基于无人机航拍的电力巡检成为目前绝缘子缺陷检测方法的主流,但当遇到图像特征不够明显或干扰特征较多等问题时,绝缘子缺陷识别困难,检测精度不高。由此,提出了一种基于改进YOLOv5s的绝缘子缺陷检测方法。首先,重新设计卷积模块,然后... 基于无人机航拍的电力巡检成为目前绝缘子缺陷检测方法的主流,但当遇到图像特征不够明显或干扰特征较多等问题时,绝缘子缺陷识别困难,检测精度不高。由此,提出了一种基于改进YOLOv5s的绝缘子缺陷检测方法。首先,重新设计卷积模块,然后将CA注意力机制与其相融合,并且在主干网络加入注意力机制与颈部网络的特征图进行多尺度特征融合,抑制复杂环境下的干扰特征,专注缺陷特征提取;其次,对空间金字塔池化结构(SPPF)进行改进,扩大感受野,减少被模型过滤掉的有用信息;接着,将Transformer与C3模块中的残差结构(Bottleneck)相结合,增强模型对绝缘子缺陷特征的识别能力;最后,使用K-means算法对数据集进行聚类分析,重新计算最适合的锚框尺寸。在数据集上进行验证,改进后的方法平均精度达到97.4%,召回率达到94.8%,均值平均精度为97.6%,该方法有效提升了复杂环境下的绝缘子缺陷检测能力,进一步满足了对绝缘子缺陷检测精度的需求。 展开更多
关键词 YOLOv5s 绝缘子 注意力机制 缺陷检测 SPPF
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部