期刊文献+
共找到88篇文章
< 1 2 5 >
每页显示 20 50 100
LDD-YOLO:改进YOLOv8的轻量级密集行人检测算法
1
作者 杨迪 张喜龙 王鹏 《计算机科学与探索》 北大核心 2026年第1期251-265,共15页
针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合... 针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合了重参数化卷积和多分支结构,分别在训练阶段和推理阶段强化特征表达能力与模型推理效率。引入了分离式大卷积核注意力机制的空间金字塔池化模块SPPF-LSKA,结合分离式大卷积核操作以扩大感受野,增强对密集目标的特征捕获能力,抑制背景干扰。为解决YOLOv8在特征处理中未能充分挖掘局部与全局信息的局限性,提出了一种改进的多尺度特征融合模块FFDM,通过融合多尺度特征信息,提升模型密集行人检测的特征表达能力。设计了一种轻量化的特征对齐检测头LSCSBD,利用不同特征层级之间的共享卷积层,提高参数利用效率并减少冗余计算。在CrowdHuman与WiderPerson数据集上的对比实验结果表明,LDD-YOLO在总体性能上优于对比模型,实现了精度与效率的平衡。 展开更多
关键词 密集行人检测 YOLO 重参数化 可分离大核注意力机制 多尺度特征融合 轻量化
在线阅读 下载PDF
基于改进YOLOv10的多尺度舰船目标图像检测算法
2
作者 刘兆华 王中训 +2 位作者 贺鹏飞 刘宁波 孙艳丽 《海军工程大学学报》 北大核心 2026年第1期45-52,共8页
针对红外与可见光舰船图像分辨率低、纹理细节欠佳以及舰船目标尺度变化大等问题,本文提出了一种基于改进YOLOv10的多尺度舰船目标图像检测算法。首先,为了提高模型的特征提取能力,在骨干网络中加入了大型可分离核注意力模块;然后,为了... 针对红外与可见光舰船图像分辨率低、纹理细节欠佳以及舰船目标尺度变化大等问题,本文提出了一种基于改进YOLOv10的多尺度舰船目标图像检测算法。首先,为了提高模型的特征提取能力,在骨干网络中加入了大型可分离核注意力模块;然后,为了适应舰船目标尺寸变化大的问题,在颈部网络中添加了多尺度扩张注意力模块,提高了模型的多尺度检测能力;最后,引入了考虑边界框形状的损失函数,提高了模型对小目标的检测能力。在采集的红外与可见光舰船图像数据集上实验结果表明:改进后的算法在增加较少参数量的基础上平均精度均值较原有模型提高了1.2%,平均精度提高了1.9%,显著提高了模型的多尺度目标检测能力。 展开更多
关键词 多尺度目标检测 红外与可见光图像 YOLOv10 大型可分离核注意力模块 多尺度扩张注意力模块
在线阅读 下载PDF
基于大核卷积注意力网络的方面级情感分析
3
作者 王经钧 苏娜 +2 位作者 徐力 裴厚清 纪淑娟 《计算机工程与设计》 北大核心 2026年第2期511-519,共9页
为解决句法建模中因过度依赖依存树单一结构引发的邻接矩阵信息缺失问题,以及语义表征中多粒度特征融合不足导致的局部-全局语义失衡难题。提出了双通道图卷积注意力大核卷积网络模型(SDLA-GCN)。在句法信息处理方面,对句法邻接矩阵进... 为解决句法建模中因过度依赖依存树单一结构引发的邻接矩阵信息缺失问题,以及语义表征中多粒度特征融合不足导致的局部-全局语义失衡难题。提出了双通道图卷积注意力大核卷积网络模型(SDLA-GCN)。在句法信息处理方面,对句法邻接矩阵进行了数据增强和优化,以生成信息更丰富的句法邻接矩阵;在语义信息处理方面,设计多尺度提取模块,即通过语义图卷积与大型选择性核网络的有效结合,提升了模型对语义特征的提取能力。在多个公开数据集上的实验结果表明,该模型在多项性能指标上均优于现有方法。 展开更多
关键词 图卷积 注意力机制 大核卷积 预训练模型 情感知识 双通道 方面级情感分析
在线阅读 下载PDF
GIS-YOLO:改进YOLOv8的GIS隔离开关实例分割算法
4
作者 黎泽阳 胡欣 +2 位作者 马滨滨 邵良彬 王茜玉 《测试技术学报》 2026年第1期112-123,共12页
气体绝缘全封闭组合电器(Gas Insulated Substation,GIS)智能可视化监测系统中受内部复杂结构和空间全封闭等因素影响,采集到的图像存在不均匀光照和细节模糊等问题,从而导致漏检和误检。为解决上述问题,提出一种基于YOLOv8的改进模型,... 气体绝缘全封闭组合电器(Gas Insulated Substation,GIS)智能可视化监测系统中受内部复杂结构和空间全封闭等因素影响,采集到的图像存在不均匀光照和细节模糊等问题,从而导致漏检和误检。为解决上述问题,提出一种基于YOLOv8的改进模型,以提高GIS隔离开关图像的实例分割效率和精度,获得更精准的分合闸状态判断。首先,采用RepNCSPELAN4模块替换原有C2f模块,利用输入通道并行处理多尺度特征,高效融合特征信息以增强模型对不同目标的感知和捕获能力;其次,提出的SPPELAN_LSKA模型由SPPELAN模块融合大核分离卷积注意力(Large Separable Kernel Attention,LSKA)机制构成,可有效提升模型在不均匀光照和细节模糊图像中的特征提取能力;最后,改进的分割头Segment_EfficientHead显著减少了参数量,提高了模型的分割效率和精度。实验结果表明,在自制的GIS隔离开关数据集上,GIS-YOLO模型相较于YOLOv8模型,在精确度、mAP_(mask)@0.5及mAP_(mask)@0.5∶0.95上分别提升了8.1、7.8和16.8百分点,模型的参数量和计算量分别降低了37.3%和13.3%。改进后的模型不仅分割性能更高,而且结构更加轻量化,满足GIS隔离开关图像在线实例分割任务。 展开更多
关键词 实例分割 YOLOv8 气体绝缘全封闭组合电器隔离开关 大核分离卷积注意力注意力 轻量化
在线阅读 下载PDF
针对小目标垃圾检测的YOLOv8网络结构改进与性能验证
5
作者 何达维 吴岳忠 +1 位作者 陈玲姣 韩梅 《包装学报》 2026年第2期103-109,共7页
为攻克复杂城市环境下的垃圾检测难题,尤其是在垃圾目标较小、背景繁杂的场景,提出一种基于YOLOv8的改进垃圾检测算法YOLO-SPRL。首先,引入SPD-Conv模块并增加P2检测层,删除P5检测层,以增强模型对小目标垃圾物体的检测能力。其次,在特... 为攻克复杂城市环境下的垃圾检测难题,尤其是在垃圾目标较小、背景繁杂的场景,提出一种基于YOLOv8的改进垃圾检测算法YOLO-SPRL。首先,引入SPD-Conv模块并增加P2检测层,删除P5检测层,以增强模型对小目标垃圾物体的检测能力。其次,在特征金字塔P3层嵌入矩形自校准模块(RCM),抑制背景噪声,消除复杂背景的干扰。最后,在模型颈部引入可分离多级卷积核注意力模块(LSKA),在降低计算复杂度的同时强化深度特征融合能力,在减小模型体积的同时提高检测精度。在VisDrone和自建街景垃圾数据集上的实验结果显示,YOLO-SPRL在VisDrone数据集上的mAP@0.5达到38.91%,相较于基准模型提升了4.22%;在自建数据集上亦展现出良好的鲁棒性和小目标识别能力。本研究所提出的集成改进策略有效提升了复杂场景下的垃圾检测性能,YOLO-SPRL在精度、速度和模型体积之间实现了良好的平衡,具备在嵌入式移动设备上部署的可行性,为城市智能环卫系统的实时监测与管理提供了可靠的技术支撑。 展开更多
关键词 YOLOv8 小目标检测 矩形自校准模块 可分离多级卷积核注意力
在线阅读 下载PDF
基于大核选择和形状自适应的遥感图像目标检测
6
作者 赵子澳 董爱华 黄荣 《宁夏大学学报(自然科学版中英文)》 2026年第1期33-41,共9页
光学遥感图像目标检测是遥感图像数据智能解译的关键技术。为了解决遥感图像目标检测时,目标尺度差异大,目标受背景因素干扰,目标形状各异的问题,提出了LMK(large multiscale kernel)网络。该网络通过大核卷积分解和多尺度注意力机制模... 光学遥感图像目标检测是遥感图像数据智能解译的关键技术。为了解决遥感图像目标检测时,目标尺度差异大,目标受背景因素干扰,目标形状各异的问题,提出了LMK(large multiscale kernel)网络。该网络通过大核卷积分解和多尺度注意力机制模块,能够动态调整空间感受野,从而更好地捕获遥感场景中物体的上下文信息。此外,设计了一种面向目标检测的形状自适应选择(SAS,shape-adaptive selection)标签分配策略。该策略将目标形状信息集中于长宽比,通过结合物体的形状信息和特征分布计算IoU(intersection over union)最优阈值。针对遥感图像目标姿态旋转定位难的问题,引入了KFIoU损失函数。实验结果表明,所提出的目标检测模型在HRSC2016、UCAS-AOD和DOTA数据集上的精度分别达到了96.73%、97.85%和77.26%。改进后的模型优于目前绝大多数目标检测算法。 展开更多
关键词 目标检测 深度学习 标签分配 多尺度注意力 大核网络
在线阅读 下载PDF
基于自适应大核卷积和特征融合的视线估计
7
作者 李晓鹏 王演 刘教 《计算机工程与设计》 北大核心 2026年第2期495-502,共8页
针对视线估计在无约束环境中准确率不高的问题,提出了一种自适应大核卷积和自适应特征融合的全脸视线估计方法。改进残差网络,增加自适应大核卷积(ALK)进行多层次的特征提取,扩大CNN的感受野,有效捕捉面部区域的细节特征;增加自适应特... 针对视线估计在无约束环境中准确率不高的问题,提出了一种自适应大核卷积和自适应特征融合的全脸视线估计方法。改进残差网络,增加自适应大核卷积(ALK)进行多层次的特征提取,扩大CNN的感受野,有效捕捉面部区域的细节特征;增加自适应特征融合(AFF)模块,根据全局信息自适应地融合多尺度局部特征,增强模型对视线的表征能力。改进后的模型在MPIIFaceGaze数据集和Gaze360数据集上进行评估,在两个数据集上测试的视线估计平均角度误差分别为4.2°和10.65°。通过与其它模型进行比较,验证了改进后的模型能够较为准确地进行三维视线估计。 展开更多
关键词 视线估计 自适应大核卷积 特征融合 残差网络 特征提取 多尺度特征 注意力机制
在线阅读 下载PDF
基于YOLOv8改进的跌倒检测算法:CASL-YOLO 被引量:1
8
作者 徐慧英 赵蕊 +1 位作者 朱信忠 黄晓 《浙江师范大学学报(自然科学版)》 CAS 2025年第1期36-44,共9页
跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部... 跌倒对老年人危害极大,是我国65岁以上老年人致残和伤害死亡的首要原因.然而,目前主流的跌倒检测技术受环境的干扰较大,在物体遮挡、光照变化等复杂场景下的检测准确率较低,且模型的参数量和计算量较高,导致成本居高不下,不能很好地部署应用于实际生活场景.针对上述问题,提出了一种在复杂环境下轻量级的基于YOLOv8模型改进的跌倒检测算法:CASL-YOLO.首先,该模型引入空间深度卷积(SPD-Conv)模块替代传统卷积模块,通过对每个特征映射进行卷积操作,保留通道维度中的全部信息,从而提高模型在低分辨率图像和小物体检测方面的性能;其次,引入基于位置信息的注意力机制,以捕获跨通道、方向和位置感知的信息,从而更准确地定位和识别人体目标;最后,在特征提取模块中引入选择性大卷积核(LSKNet)动态调整感受野,以有效处理跌倒检测场景中的复杂环境信息,提高网络的感知能力和检测精度.实验结果表明,在公开的Human Fall数据集上,CASL-YOLO的mAP@0.5达到96.8%,优于基线YOLOv8n,同时模型仅有3.4×MiB的参数量和11.7×10^(9)的计算量.相比其他检测算法,CASL-YOLO在参数量和计算量小幅增加的情况下,实现了更高的精度和性能,同时满足实际场景的部署要求. 展开更多
关键词 跌倒检测 YOLOv8 注意力机制 空间深度卷积 选择性大卷积核
在线阅读 下载PDF
基于EE-YOLOv8s的多场景火灾迹象检测算法 被引量:5
9
作者 崔克彬 耿佳昌 《图学学报》 北大核心 2025年第1期13-27,共15页
针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征... 针对目前烟火场景检测中,光照变化、烟火动态性、复杂背景、目标过小等干扰因素导致的火灾迹象目标误检和漏检的问题,提出一种YOLOv8s改进模型EE-YOLOv8s。设计MBConv-Block卷积模块融入YOLOv8的Backbone部分,实现EfficientNetEasy特征提取网络,保证模型轻量化的同时,优化图像特征提取;引入大型可分离核注意力机制LSKA改进SPPELAN模块,将空间金字塔部分改进为SPP_LSKA_ELAN,充分捕获大范围内的空间细节信息,在复杂多变的火灾场景中提取更全面的特征,从而区分目标与相似物体的差异;Neck部分引入可变形卷积DCN和跨空间高效多尺度注意力EMA,实现C2f_DCN_EMA可变形卷积校准模块,增强对烟火目标边缘轮廓变化的适应能力,促进特征的融合与校准,突出目标特征;在Head部分增设携带有轻量级、无参注意力机制SimAM的小目标检测头,并重新规划检测头通道数,加强多尺寸目标表征能力的同时,降低冗余以提高参数有效利用率。实验结果表明,改进后的EE-YOLOv8s网络模型相较于原模型,其参数量减少了13.6%,准确率提升了6.8%,召回率提升了7.3%,mAP提升了5.4%,保证检测速度的同时,提升了火灾迹象目标的检测性能。 展开更多
关键词 烟火目标检测 EfficientNetEasy主干网络 大型可分离核注意力机制 可变形卷积校准模块 小目标检测
在线阅读 下载PDF
融合改进注意力的自适应双分支密集行人检测 被引量:1
10
作者 李建东 焦晓光 曲海成 《计算机系统应用》 2025年第7期23-36,共14页
为解决复杂背景干扰导致的行人检测精度低和漏检率高的问题,本文提出一种融合改进注意力的自适应双分支密集行人检测算法DACD-YOLO.首先,主干网络采用自适应融合双分支结构,通过动态权重实现不同特征的融合,并引入深度可分离卷积降低计... 为解决复杂背景干扰导致的行人检测精度低和漏检率高的问题,本文提出一种融合改进注意力的自适应双分支密集行人检测算法DACD-YOLO.首先,主干网络采用自适应融合双分支结构,通过动态权重实现不同特征的融合,并引入深度可分离卷积降低计算量,有效缓解传统单分支网络中信息丢失的问题;其次,提出自适应视觉中心,通过动态优化增强层内特征提取,并重设通道数以平衡精度与计算量;然后,提出坐标双通道注意力机制,结合异构卷积核设计轻量化融合模块,降低计算复杂度并增强对关键特征的捕捉能力;最后,采用膨胀卷积检测头,通过不同膨胀率卷积融合多尺度特征,有效增强小目标和遮挡目标的特征提取能力.实验结果表明,与原版YOLOv8n相比,改进算法在WiderPerson数据集上的mAP@0.5和mAP@0.5:0.95分别提高2.3%和2.2%,在CrowdHuman数据集上mAP@0.5和mAP@0.5:0.95分别提升3.5%和4.6%.实验结果表明,改进算法在密集行人检测方面相较于原算法具有显著的精度提升. 展开更多
关键词 行人检测 自适应 双分支 深度可分离卷积 注意力机制 异构卷积核
在线阅读 下载PDF
增强特征表示的绝缘子缺陷检测方法
11
作者 李丽芬 王明 +1 位作者 曹旺斌 梅华威 《计算机工程与设计》 北大核心 2025年第8期2373-2379,共7页
针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提... 针对绝缘子缺陷目标区域较小、部分缺陷特征相似,从而导致检测精度较低的问题,提出了一种特征表示增强模型(FLDM-YOLO)。该模型基于FasterNet重构特征提取网络并且结合大核可分离注意力(LSKA)设计了SPPF-LSKA模块,增强了对目标的特征提取能力;以重参数化技术为基础,提出了C2f-DBB模块,处理目标缺陷特征相似的问题;在边界框回归阶段使用MPDIoU作为损失函数,使得模型更加关注高质量锚框。实验结果表明,FLDM-YOLO模型在保证一定检测速度的前提下,mAP为91.3%,较YOLOv8模型提高了4.2%,可有效应用于实际的巡检工作。 展开更多
关键词 目标检测 绝缘子 部分卷积 主干特征提取网络 大核可分离注意力 重参数化 边界框损失函数
在线阅读 下载PDF
轻量且高精度增强的姿态检测网络HG-YOLO
12
作者 崔家礼 刘永基 +1 位作者 李子贺 郑瀚 《计算机应用》 北大核心 2025年第12期4004-4011,共8页
在人体姿态检测任务中,现有的深度学习网络存在检测精度不足、网络参数复杂和计算成本高等问题,严重限制了它们的应用。为了解决这些问题,提出一种轻量且高精度的姿态检测改进网络HG-YOLO(High-precision and Ghost YOLO)。针对检测精... 在人体姿态检测任务中,现有的深度学习网络存在检测精度不足、网络参数复杂和计算成本高等问题,严重限制了它们的应用。为了解决这些问题,提出一种轻量且高精度的姿态检测改进网络HG-YOLO(High-precision and Ghost YOLO)。针对检测精度不足的问题,在HG-YOLO的主干网络,融合基于Transformer的检测网络RT-DETR(Real-Time DEtection TRansformer),并将大型可分离核注意力(LSKA)模块嵌入主干网络中,以在不增加内存占用和计算复杂性的基础上,提高网络应对复杂场景的特征提取能力,从而提高人体姿态的检测精度。针对网络参数复杂和计算成本高的问题,引入轻量化的Ghost卷积模块替换部分标准卷积,此外,在HG-YOLO的检测头部分,设计一种共享卷积检测头,以通过参数和权重共享机制减少卷积计算,从而降低网络的参数量和计算复杂度。在COCO(Common Objects in COntext)2017-Keypoints数据集和CrowdPose数据集上的实验结果表明,与基准的YOLOv8-Pose网络相比,HG-YOLO的参数量减少了32%,浮点运算量减少了18%;在规模为小型(s)时,在COCO 2017-Keypoints数据集上,AP50(Average Precision at OKS(Object Keypoint Similarity)of 0.50)提升了0.8个百分点,在CrowdPose数据集上,AP提升了2.9个百分点。可见,HG-YOLO不仅轻量,而且检测精度高,是人体姿态检测领域的优秀网络模型。 展开更多
关键词 姿态检测 高精度增强 大型可分离核注意力 共享卷积检测头 轻量化网络
在线阅读 下载PDF
多尺度大核注意力遥感图像语义分割实验设计
13
作者 项学智 宁怡博 +2 位作者 王路 贲晛烨 乔玉龙 《实验室研究与探索》 北大核心 2025年第10期56-62,共7页
针对遥感图像语义分割任务中卷积神经网络(CNN)远程建模能力不足与Transformer计算复杂度过高的问题,提出一种基于多尺度大核注意力(MSLKA)的遥感图像语义分割网络MSLKASeg。MSLKA将多尺度机制与大核注意力(LKA)相结合,并引入门控机制... 针对遥感图像语义分割任务中卷积神经网络(CNN)远程建模能力不足与Transformer计算复杂度过高的问题,提出一种基于多尺度大核注意力(MSLKA)的遥感图像语义分割网络MSLKASeg。MSLKA将多尺度机制与大核注意力(LKA)相结合,并引入门控机制以抑制无关信息,能在保持较低复杂度的同时,生成多粒度级别的注意力图,从而有效聚合全局和局部信息。在两个典型数据集实验表明,所提方法取得了具有竞争力的结果。在ISPRS Vaihingen数据集上,mF1和mIoU得分分别达到了90.31%和82.73%;在LoveDA Urban数据集,mF1和mIoU得分分别为66.24%和50.41%。多场景实验结果表明,所提方法有效提升了遥感图像语义分割效果。 展开更多
关键词 遥感图像 语义分割 多尺度大核 大核注意力
在线阅读 下载PDF
基于改进的DeepLabV3+的海岸线遥感图像分割方法
14
作者 连帅 《电子测量技术》 北大核心 2025年第24期51-58,共8页
针对海岸线遥感图像存在的不规则边界精细化分割困难的问题,本文提出了非对称性多路解码的海岸线分割网络(AMDNet)。以Deeplabv3+作为主干网络,通过使用EfficientNet-B0作为特征提取器,大幅降低网络计算量,并在改进的ASPP中引入D-LKA模... 针对海岸线遥感图像存在的不规则边界精细化分割困难的问题,本文提出了非对称性多路解码的海岸线分割网络(AMDNet)。以Deeplabv3+作为主干网络,通过使用EfficientNet-B0作为特征提取器,大幅降低网络计算量,并在改进的ASPP中引入D-LKA模块,添加额外的偏移量来调整标准卷积的采样位置,允许卷积核灵活调整采样网格,结合DUpsampling技术实现上采样过程中的高精度还原,提高图像分割的精确度。AMDNet模型在Aerial photo-maps数据集上的准确率、灵敏度、Dice和Jaccard分别达到了96.77%、93.03%、90.42%、86.67%,性能提升明显。 展开更多
关键词 海岸线遥感图像分割 DeepLabV3+ 可变大核注意力 EfficientNet
原文传递
基于多路径自适应信息增强的矿井图像超分辨率重建方法
15
作者 齐爱玲 付远远 张广明 《煤炭科学技术》 北大核心 2025年第11期172-184,共13页
煤矿井下环境复杂,光照条件差,高湿度与悬浮粉尘易形成水雾和辉光,导致高频信息缺失与边缘细节模糊,同时叠加噪声干扰。为提升矿井图像质量,解决矿井场景下超分辨率重建中噪声抑制与细节恢复的协同难题,提出一种基于多路径自适应信息增... 煤矿井下环境复杂,光照条件差,高湿度与悬浮粉尘易形成水雾和辉光,导致高频信息缺失与边缘细节模糊,同时叠加噪声干扰。为提升矿井图像质量,解决矿井场景下超分辨率重建中噪声抑制与细节恢复的协同难题,提出一种基于多路径自适应信息增强的矿井图像超分辨率重建方法。方法上,首先设计残差多路径特征聚集块(Residual Multi-path Feature Aggregation Block,RMFAB),通过残差学习和多路径自适应卷积网络(Multi-path Adaptive Convolution Network,MACN)充分利用不同路径的特征,增强全局与局部高频信息建模能力;其次,引入多注意力融合模块,在通道和空间维度聚焦图像中的高频信息,提升特征表达能力;最后,构建大核感知块(Large Kernel Perception Block,LKPA),利用多尺度卷积扩展感受野并实现层次特征融合,从而优化图像纹理与结构细节。实验在公开矿井数据集CMUID上开展,结果显示该算法在峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和结构相似性(Structural Similarity,SSIM)指标上优于其他主流先进算法。尤其在缩放因子为4时,该算法在PSNR指标上较Bicubic、CRAFT-SR、PAN、ESRGCNN、DiVANet及SMAFNet分别提升2.88、2.04、1.94、1.52、0.53、0.36 dB;SSIM指标分别提升4.32%、3.37%、3.20%、2.74%、3.19%、1.08%。实验结果表明,该方法实现了对矿井图像多层次特征的精细化提取与融合,在抑制噪声干扰的同时有效恢复了复杂纹理特征,提升了矿井图像的超分辨率重建质量,为煤矿井下智能感知提供了技术支持。 展开更多
关键词 矿井图像 超分辨率重建 多路径自适应卷积 大核感知块 并联多注意力机制
在线阅读 下载PDF
基于语义增强网络的跨模态行人重识别
16
作者 宋存利 张媛媛 张雪松 《大连交通大学学报》 2025年第3期114-120,共7页
由于图像之间存在显著的模态差异,跨模态行人重识别仍是一项具有挑战性的检索任务,其关键在于有效学习模态的不变性特征。对此,提出一种基于语义增强网络的跨模态行人重识别方法(SEL-Net)。该方法能够轻量化学习模态间不变性信息特征表... 由于图像之间存在显著的模态差异,跨模态行人重识别仍是一项具有挑战性的检索任务,其关键在于有效学习模态的不变性特征。对此,提出一种基于语义增强网络的跨模态行人重识别方法(SEL-Net)。该方法能够轻量化学习模态间不变性信息特征表示,有效捕捉不同模态间的相似性,以减小可见光和红外图像的模态差异。SELNet是由通道一致性特征增强(CCFE)模块和大核空间注意(LKSA)模块构成的多维感知特征增强网络,其中CCFE模块通过强调输入特征通道之间的非线性关系捕捉通道维度的一致性特征,以减小模态差异;LKSA模块在提高局部特征上下文关系的同时,通过增大感受野提高远程信息获取能力,增强语义表征。试验结果表明,该方法在SYSU-MM01和RegDB数据集上,mAP和Rank-1值分别达到了67.58%和72.65%、82.36%和91.50%,充分验证了其有效性。 展开更多
关键词 行人重识别 跨模态 多层感知 大核注意
在线阅读 下载PDF
多尺度大核注意力特征融合网络的图像超分辨率重建
17
作者 宋霄罡 张鹏飞 +2 位作者 刘万波 鲁晓锋 黑新宏 《中国图象图形学报》 北大核心 2025年第4期1084-1099,共16页
目的图像超分辨率重建是计算机视觉领域内的基础任务。卷积神经网络通过滑动窗口机制和参数共享特性能够有效提取局部特征,但对图像远距离信息的感知能力较弱。Transformer中的自注意力机制可以更好地捕捉序列中的全局依赖关系,但同时... 目的图像超分辨率重建是计算机视觉领域内的基础任务。卷积神经网络通过滑动窗口机制和参数共享特性能够有效提取局部特征,但对图像远距离信息的感知能力较弱。Transformer中的自注意力机制可以更好地捕捉序列中的全局依赖关系,但同时会带来高额计算资源占用的问题。方法为了解决这些问题,本文提出了一种基于多尺度大核注意力特征融合网络的超分辨率重建方法MLFN(multi-scale large kernel attention feature fusion net⁃work),该网络采用多路径结构学习不同的水平特征表示,从而增强网络的多尺度提取能力。此外,设计了一种多尺度大核可分离卷积块,它兼顾了自注意力机制强大的全局信息捕捉能力和卷积强大的局部感知能力,能更好地提取全局特征与局部特征。同时,在末端加入了轻量级的标准化注意力模块,在进一步增强模型性能的同时,实现了网络模型的轻量化设计。结果基于5个公开测试数据集,与11种代表性方法进行了实验对比,结果表明本文方法在不同放大倍数下均有最佳表现,所提MLFN比信息多重蒸馏网络(iterative mean distillation network,IMDN)的峰值信噪比(peak signal-to-noise ratio,PSNR)平均提升0.2 dB,重建图像在视觉上具有明显优势。结论本文提出了一种基于多尺度大核注意力特征融合网络的超分辨率重建方法,借助精心设计的多尺度大核可分离卷积块,有效提高了网络的长距离关系建模能力,利用多路提取块引入多尺度特征进一步提高重建精度,引入标准化注意力模块在实现性能提升的同时维持较低的计算资源消耗。 展开更多
关键词 图像超分辨重建 大核可分离卷积 注意力机制 特征融合 多路学习
原文传递
注意力引导多任务学习的前列腺癌盆腔淋巴结转移预测
18
作者 张志远 胡冀苏 +3 位作者 张跃跃 钱旭升 周志勇 戴亚康 《上海交通大学学报》 北大核心 2025年第8期1216-1224,共9页
基于前列腺癌原发灶的术前磁共振影像定量特征预测盆腔淋巴结转移(PLNM)是治疗方案制定的重要参考依据.然而,现有预测方法对肿瘤原发灶内部的异质性信息提取不足,导致提取的图像定量特征与PLNM关联性较弱.针对这一问题,提出一种以肿瘤... 基于前列腺癌原发灶的术前磁共振影像定量特征预测盆腔淋巴结转移(PLNM)是治疗方案制定的重要参考依据.然而,现有预测方法对肿瘤原发灶内部的异质性信息提取不足,导致提取的图像定量特征与PLNM关联性较弱.针对这一问题,提出一种以肿瘤分割任务为辅助任务的注意力引导多任务学习网络用于PLNM预测.首先,在肿瘤分割网络中,提出多分支各向异性大核注意力模块,通过不同分支和各向异性大卷积核的融合扩大的感受野以有效捕获肿瘤的局部和全局信息.其次,在PLNM预测网络中,设计多尺度特征交互融合注意力模块,对多尺度特征进行层次化融合筛选.在320例数据集的实验中,所提方法的精度召回曲线下面积值和受试者操作特征曲线下面积值分别为(85.44±2.04)%和(91.86±2.18)%,优于经典的单任务分类方法和多任务方法. 展开更多
关键词 前列腺癌盆腔淋巴结转移 多任务学习 多分支各向异性大核注意力模块 多尺度特征交互融合注意力模块 多参数磁共振
在线阅读 下载PDF
基于改进Yolov8的红外弱小目标识别算法
19
作者 李雪峰 李宁 +2 位作者 吴迪 于祥跃 郭永强 《激光与红外》 北大核心 2025年第5期789-797,共9页
为解决现有深度学习网络结构对红外弱小目标的识别针对性不足问题,提出了一种基于改进Yolov8的红外弱小目标识别算法(Yolov8n based on UniRepLK Block and Triplet Attention,UT-Yolov8)。该算法通过特征融合网络输出端的检测头引入三... 为解决现有深度学习网络结构对红外弱小目标的识别针对性不足问题,提出了一种基于改进Yolov8的红外弱小目标识别算法(Yolov8n based on UniRepLK Block and Triplet Attention,UT-Yolov8)。该算法通过特征融合网络输出端的检测头引入三重注意力机制,为特征融合网络内部添加新的小目标检测层、检测头,以及在特征提取网络的空间池化金字塔内结合大内核卷积,针对红外弱小目标的成像特性进行改进。算法在真实红外图像数据上进行验证,实验结果表明,UT-Yolov8算法在保持高检测速度的同时,有效提高了网络对于红外弱小目标识别精度,平均精度均值mAP@0.5达到了95.9%。 展开更多
关键词 红外弱小目标识别 Yolov8 大内核卷积 三重注意力机制 目标检测
在线阅读 下载PDF
结合多尺度大核卷积的红外图像人体检测算法
20
作者 邵煜潇 鲁涛 +2 位作者 王震宇 彭勇杰 姚巍 《智能系统学报》 北大核心 2025年第4期787-799,共13页
针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(... 针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(re-parameterization multi-scale large kernel convolution)。该网络通过空间和通道重构注意力模块,将注意值集中到对检测任务更重要的区域。通过Sobel算子强化边缘特征,提高对不同姿态人体的检测能力。RML-YOLO的有效性在自制数据集上得到验证。在只有1.8×10~6可学习参数的情况下,模型的AP50和AP50-75分别达到了91.2%和87.3%,与参数量相近的YOLOv8-n相比分别提高了4.4%和5.3%。结果表明,RML-YOLO显著提高了利用红外图像进行废墟环境下人体检测的精度。 展开更多
关键词 红外图像 目标检测 重构注意力 多尺度特征 大核卷积 卷积神经网络 特征提取 重参数化
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部