期刊文献+
共找到151,047篇文章
< 1 2 250 >
每页显示 20 50 100
基于层内融合和跨层增强两阶段融合的RGB-P图像语义分割 被引量:1
1
作者 蔡轶珩 何秉芳 +1 位作者 何楷祺 何彦良 《计算机工程与应用》 北大核心 2026年第2期266-276,共11页
偏振信息能有效揭示各类物体材料差异,与可见光图像融合,可显著增强网络语义分割能力。然而,现有的大多数可见光-偏振(RGB-P)图像语义分割方法忽视了偏振图关键细节信息的保留且采用通用的交互融合方式,这导致复杂场景下分割结果容易出... 偏振信息能有效揭示各类物体材料差异,与可见光图像融合,可显著增强网络语义分割能力。然而,现有的大多数可见光-偏振(RGB-P)图像语义分割方法忽视了偏振图关键细节信息的保留且采用通用的交互融合方式,这导致复杂场景下分割结果容易出现边缘模糊和语义混淆。针对这些问题,提出了一种基于层内融合和跨层增强的递进式两阶段融合网络(IFCE-Net)。在第一阶段,设计跨模态多尺度交互机制,其结合多尺度化操作使RGB和偏振图像每级特征实现空间和通道信息的交互,加之混合通道嵌入操作,该阶段实现了多模态层内特征互补性探索和精细融合。在第二阶段,通过设计具有自适应权重的跨层增强策略,以逐级联合强化各层特征,从而显著提高网络对物体边缘等关键细节信息的保留能力。在公开ZJU-RGB-P和MCubeS数据集上进行实验,结果表明,该网络在定性和定量评估中均优于当前先进的RGB-P图像分割方法。 展开更多
关键词 RGB-P图像语义分割 跨模态多尺度交互机制 逐级联合增强
在线阅读 下载PDF
基于图像匹配的高空大斜视无源目标定位
2
作者 贾平 李昌灏 +3 位作者 孙辉 宋悦铭 祃卓荦 徐芳 《光学精密工程》 北大核心 2026年第1期124-138,共15页
提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似... 提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似正射变换,并截取对应区域的卫星图像。采用RepVGG提取图像粗特征,通过互最近邻实现初步匹配,并结合MiHo与归一化互相关(Normalized Cross Correlation,NCC)筛选匹配点对。最后,借助Transformer模块完成精细化匹配,再根据精匹配结果构建角度误差修正矩阵,多次迭代修正系统误差。实验结果表明,所提方法的定位精度较传统方法有较大幅度提升,在典型应用场景下提升约70%,在斜距90 km的情况下,定位精度可维持在120 m左右。该方法突破了传统无源定位对角度精度的高度依赖,验证了基于图像匹配的无源定位路径的可行性与有效性。 展开更多
关键词 图像匹配 目标定位 航空光电系统 无源定位 大斜视 TRANSFORMER
在线阅读 下载PDF
用于低剂量CT图像降噪的多路特征生成对抗网络
3
作者 王丽芳 任文婧 +2 位作者 郭晓东 张荣国 胡立华 《计算机应用》 北大核心 2026年第1期270-279,共10页
近些年,把生成对抗网络(GAN)应用于低剂量计算机断层扫描(LDCT)图像降噪取得了显著进展。然而,现有方法存在对复杂噪声分布建模能力不足以及结构细节保留能力有限等问题。因此,提出一种用于LDCT图像降噪的多路特征GAN——Trident GAN。... 近些年,把生成对抗网络(GAN)应用于低剂量计算机断层扫描(LDCT)图像降噪取得了显著进展。然而,现有方法存在对复杂噪声分布建模能力不足以及结构细节保留能力有限等问题。因此,提出一种用于LDCT图像降噪的多路特征GAN——Trident GAN。首先,设计特征引导生成器Trident Uformer,通过在U-Net结构的瓶颈层增加特征聚合注意力(FPA)模块解决U型结构空间分辨率较低的问题;其次,设计多路特征提取子模块Trident Block,并在3个分支中分别引入局部细节增强模块(LDEB)提取细节特征,轻量通道注意力模块(LCAB)增强通道特征,以及空间交互注意力模块(SIAB)获得重要空间特征;在SIAB中采用多级交互式注意力函数和评估机制设计空间上下文注意力机制(SCAM),解决单一注意力受限的问题;最后,设计多特征融合(MFF)模块来在三分支末端进行特征聚合,并对局部细节信息和全局语义信息进行建模,解决不同层次之间细节不连续的问题。此外,利用多尺度金字塔判别器(MSPD)在不同维度下检查生成结果的质量,指导具有全局一致性图像的生成。实验结果表明,在Mayo和Piglet数据集上,Trident GAN的平均峰值信噪比(PSNR)和结构相似性(SSIM)分别达到了31.5193 dB/0.8830和33.6331 dB/0.9478,与高频敏感GAN(HFSGAN)相比,参数量降低75.58%,测试时间缩短36.36%。可见,与HFSGAN等方法相比,Trident GAN可在较少的计算负荷下提高了图像质量。 展开更多
关键词 低剂量计算机断层扫描 图像降噪 注意力机制 TRANSFORMER 生成对抗网络
在线阅读 下载PDF
WTNet-YOLO:结合离散小波变换与Transformer的棉田害虫检测算法
4
作者 刘江涛 周刚 +2 位作者 刘浩南 王佳佳 贾振红 《计算机工程与应用》 北大核心 2026年第3期226-240,共15页
棉花生长过程中受到害虫严重危害,因此精准的害虫检测已成为智慧农业体系中的关键环节。其中大量棉田害虫属于小目标,特征提取困难,而且害虫个体之间存在显著的尺寸差异,这限制了现有目标检测算法的性能。提出了一种结合离散小波变换与T... 棉花生长过程中受到害虫严重危害,因此精准的害虫检测已成为智慧农业体系中的关键环节。其中大量棉田害虫属于小目标,特征提取困难,而且害虫个体之间存在显著的尺寸差异,这限制了现有目标检测算法的性能。提出了一种结合离散小波变换与Transformer的YOLO11目标检测算法——WTNet-YOLO(wavelet and Transformer network-YOLO)。融合部分卷积与多尺度深度卷积构建C3K2-MKPF模块,增强对多尺寸目标的特征提取能力。在颈部结合小波域融合模块(wavelet domain fusion module,WDFM)和跨阶段部分局部和全局模块(cross stage partial local and global block,CSP-LGB),提升各尺寸害虫的频域信息表达与全局信息定位。引入多尺度自适应空间注意门(multi-scale adaptive spatial attention gate,MASAG),动态融合主干与颈部的跨层特征,强化空间与语义信息表达。为验证相关方法,构建了一个棉田害虫数据集YST-PestCotton(yellow sticky trap pest dataset in cotton),涵盖多个尺寸范围的害虫,具有显著的尺度多样性,害虫像素面积最大可相差1200多倍。实验表明,在YST-PestCotton上mAP50提升了3.1个百分点,同时将害虫按目标框面积划分为0~256、256~512、512~1024和大于1024四个子集,mAP50分别提升2.4、1.3、1.5、3个百分点。在公开数据集Yellow sticky traps上mAP50达到了最高的95.3%。综合来看,WTNet-YOLO能够有效应对小目标内部的尺寸差异,同时兼顾不同尺寸害虫的检测需求。 展开更多
关键词 智慧农业 害虫检测 小目标 多尺寸
在线阅读 下载PDF
基于YOLOv8s多阶段算法的幼猪吮乳行为识别研究
5
作者 陈创业 刘兹豪 +4 位作者 胡天让 谢晓丽 李洋 陈立涛 刘根新 《农机化研究》 北大核心 2026年第3期185-193,共9页
针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助De... 针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助DeepSORT算法来实行跨帧目标追踪并分配唯一标识;然后,把多张连续检测图片输入到LSTM模型里进行时序建模,从而判定出该段时间范围内的幼猪是否正在吮乳。于养殖场的母猪产房拍摄了26 320张照片、采集了4 930组行为序列数据集进行试验,结果表明,在mAP@0.5评价标准下,以YOLOv8s模型为基准的目标检测准确率为91.7%,召回率为92.3%,系统整体追踪准确值(MOTA)达到85.6%,且系统可在复杂的养殖环境下做到稳定运行。将该系统布置到云端平台上,可进行云端处理、数据可视化和远程监控等功能,即时展示每头幼猪的吮乳次数和时长,快速找出进食异常的幼猪个体,优化管理效率。 展开更多
关键词 幼猪行为识别 目标检测 多目标跟踪 时序模型 吮乳监测 智能养殖
在线阅读 下载PDF
基于深度霍夫投票的建筑点云轻量级表面重建
6
作者 陈佳舟 朱肖航 +5 位作者 徐阳辉 高崟 鲁一慧 毛真 李胜龙 章超权 《浙江大学学报(工学版)》 北大核心 2026年第2期341-350,共10页
针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难... 针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难的问题,使用深度霍夫投票预测建筑平面,采用基于面的非极大值抑制算法(F-NMS)有效去除预测的重复面以及错误面.设计建筑平面相邻关系预测模块,对经过非极大值抑制后的建筑平面进行相邻关系的预测.定量实验结果表明,与如PolyFit的传统方法相比,所提方法在拟合精度与场景适应性方面均具有显著优势.使用所提方法重建的建筑多边形网格模型保留了输入建筑点云的主要结构特征,存储量不到原始点云的1%. 展开更多
关键词 三维点云 建筑简化 三维重建 霍夫投票 网格模型
在线阅读 下载PDF
基于FPGA的低照度图像增强算法的研究与实现
7
作者 肖剑 李志斌 +2 位作者 杨进 程鸿亮 胡欣 《计算机工程与科学》 北大核心 2026年第1期98-107,共10页
针对深度学习等软件方法实现低照度图像增强算法时,计算量大且复杂、实时性差等问题,实现了一种便于部署到FPGA上的基于Retinex模型的改进的低照度图像增强算法。该算法首先将输入的低照度图像进行RGB色彩空间到YCbCr色彩空间的转换,取... 针对深度学习等软件方法实现低照度图像增强算法时,计算量大且复杂、实时性差等问题,实现了一种便于部署到FPGA上的基于Retinex模型的改进的低照度图像增强算法。该算法首先将输入的低照度图像进行RGB色彩空间到YCbCr色彩空间的转换,取空间中的Y分量作为初始照度分量对其进行自适应伽玛校正和双边滤波处理,提高初始照度分量亮度的同时实现对图像的降噪和对细节的增强,接着依据Retinex模型得到增强图像。将增强后的图像再次转换到YCbCr色彩空间,对Y分量进行多尺度细节增强后转换到RGB色彩空间,作为最终的增强结果输出。实验结果表明,将在FPGA上部署所提出的低照度图像增强算法和在MATLAB上进行算法仿真后的输出图像进行比较,两者的相似度指标SSIM接近1,肉眼很难分辨出两者的差别;在时钟频率为200 MHz时,处理一幅分辨率为1280×720的图像仅需约21 ms;将所提出的算法部署在国产某型号的FPGA上时资源占用率较低,功耗为3.357 W,满足低功耗要求,具有较大的实用意义和工程应用价值。 展开更多
关键词 图像增强 FPGA 自适应伽玛校正 双边滤波 多尺度细节增强
在线阅读 下载PDF
通道注意力指导全局-局部语义协同的表情识别
8
作者 吕景刚 高硕 +1 位作者 李玉芝 周金 《计算机科学》 北大核心 2026年第1期195-205,共11页
情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通... 情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通道注意力策略,并结合全局和局部特征的协同机制来提升识别性能。首先,提出了一种抗噪数据增强策略,通过随机高斯模糊、透视变换和色彩扰动等抗噪预处理技术,结合图像拼接、随机翻转和旋转,在保留原始表情的细微特征的同时,提升图像清晰度并丰富数据集多样性和模型在细微情感识别中的鲁棒性。然后,设计了自适应分组排序的通道注意力模块(Channel Attention Module with Adaptive Channel Reordering,CAM-ACR),根据通道注意力函数对通道特征进行重排序,再经分组卷积和拼接获取包含多维度语义信息的局部特征。其次,在局部-全局特征增强机制中,利用局部特征指导优化全局特征的提取,增强全局特征对复杂情感模式和上下文信息的表征能力。最后,将局部特征与全局特征输入改进的交叉注意力融合模块,实现全局与局部特征之间的双向引导与协同增强。实验结果表明,所提方法在RAF-DB,CK+,FER2013和FER2013PLUS数据集上准确率分别达到91.21%,98.31%,74.54%和86.74%,在RAF-DB上学习效率和收敛稳定性均有优势^(1)。 展开更多
关键词 表情识别 局部特征 全局特征 注意力机制 噪声对抗
在线阅读 下载PDF
用于鱼眼图像自适应矫正的注意力金字塔网络
9
作者 张博 李雪 +4 位作者 王白阳 李光健 王国平 潘杨 朱磊 《电光与控制》 北大核心 2026年第1期106-111,共6页
针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增... 针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增强空间金字塔(AASP)模块以加强特征提取;其次,考虑到不同区域的畸变程度差异,在失真矫正阶段引入可变形卷积,以自适应处理不同程度的畸变;最后,为解决失真矫正过程中信息细节丢失导致的图像模糊问题,在编码阶段嵌入SimAM注意力机制,以专注图像关键区域。仿真结果表明:APFC-Net在Place 2数据集上优于MLC和SimFIR等方法;相较于PCN方法,其PSNR和SSIM分别提升9.11%和27.14%,验证了模型在图像矫正中的有效性。 展开更多
关键词 鱼眼图像 畸变矫正 机器视觉 深度学习
在线阅读 下载PDF
基于视图学习和通道特征拓扑融合的骨架行为识别
10
作者 谭台哲 张泽翰 +3 位作者 胡平川 朱辉果 战荫伟 杨卓 《计算机工程与设计》 北大核心 2026年第1期217-225,共9页
在人体骨架行为识别中,图卷积网络可提取人体骨架拓扑结构来聚合特征信息。但现有方法既未有效关联骨架特征与拓扑关系,也忽略了不同视图下拓扑关系的变化性。为此,提出基于视图学习和通道特征拓扑融合的行为识别方法(VLCTF-GCN)。依据... 在人体骨架行为识别中,图卷积网络可提取人体骨架拓扑结构来聚合特征信息。但现有方法既未有效关联骨架特征与拓扑关系,也忽略了不同视图下拓扑关系的变化性。为此,提出基于视图学习和通道特征拓扑融合的行为识别方法(VLCTF-GCN)。依据骨架的视图特征学习拓扑关系,为每个视图构建具有区分性的共享视图拓扑关系。在不同聚合程度上,结合视图与自适应拓扑关系,融合骨架通道特征与拓扑关系,使得拓扑结构能够自适应关联骨架特征,通过多尺度时间卷积提取不同时间长度的关节变化。在两个大型数据集的实验结果表明,所提方法性能优于现有方法。 展开更多
关键词 行为识别 人体骨架 图卷积 通道特征拓扑融合 视图学习 多尺度时间卷积 共享拓扑
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
11
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于轻量化SuperPoint网络的水下光学图像特征提取
12
作者 刘艳 朱昌盛 +1 位作者 余彬 霍冠英 《河海大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意... 针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意力融合模块,融合频域与空间域的特征信息,提升网络在水下退化图像中的特征提取能力;构建残差特征增强深度可分离卷积模块,以降低模型复杂度并增强网络的特征提取能力。验证结果表明:该网络较SuperPoint网络参数量减少了13.8%,计算量降低了8.0%,帧率提升31.7%,光照变化和视角变化下的重复率分别提高了2.3%和2.1%,在SQUID和FLSea数据集上的特征点检测与匹配性能评估中具有较好的特征提取鲁棒性。 展开更多
关键词 水下光学图像 SuperPoint网络 轻量化网络 特征提取 特征融合
在线阅读 下载PDF
基于改进RT-DETR的有遮挡交通标志检测算法
13
作者 于天河 杨壮壮 +2 位作者 胡金帅 常梦瑶 王文龙 《工程科学学报》 北大核心 2026年第2期393-408,共16页
针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏... 针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏,自建一个遮挡条件下的交通标志数据集.然后,在反向残差移动块中引入膨胀重参数块,构建了一个轻量级的复合膨胀残差块来替换原始主干提取网络中的BasicBlock,增强了模型的特征提取能力.最后,对RT-DETR模型的损失函数进行了优化,提出了DS-IoU联合损失函数加快收模型敛速度.实验结果表明,改进后的算法在自制数据集上的m AP为94.2%,相比于原始算法增加量为4.7%,在公开数据集TT100K和CCTSDB2021的m AP分别为92.8%和91.7%,相比于原始算法增加量分别为3.1%和2.4%,Params和GFLOPs相比于原始的算法分别降低了26.0%和12.5%.本文提出的改进方法极大地减少了计算量和参数数量,有效提升了遮挡情况下的交通标志的检测精度. 展开更多
关键词 交通标志检测 RT-DETR 遮挡数据集 轻量化 联合损失函数
在线阅读 下载PDF
改进的有雾图像中被遮挡车辆及行人识别算法
14
作者 于天河 王文龙 +2 位作者 刘镛 杨壮壮 侯善冲 《浙江大学学报(工学版)》 北大核心 2026年第4期738-750,共13页
针对智能自动驾驶场景中目标遮挡与雾天干扰导致的目标检测精度下降问题,提出2项关键技术改进.针对目标遮挡问题提出改进检测方法,以集成增强注意力机制的轻量化MobileNetV3_small作为SSD骨干特征提取网络,结合多尺度特征融合机制与自... 针对智能自动驾驶场景中目标遮挡与雾天干扰导致的目标检测精度下降问题,提出2项关键技术改进.针对目标遮挡问题提出改进检测方法,以集成增强注意力机制的轻量化MobileNetV3_small作为SSD骨干特征提取网络,结合多尺度特征融合机制与自适应超参数Soft-NMS算法提升遮挡场景下的检测精度,通过改进自适应Focal Loss重构置信度损失函数,缓解正负样本不平衡及噪声标签敏感性问题.针对雾天图像中目标模糊的问题提出改进轻量化AOD-Net去雾方法,通过构建基于深度可分离卷积的多尺度特征提取网络,优化跨层连接结构并引入边界增强模块,有效提升图像对比度、增强纹理细节.通过联合损失函数对去雾网络与检测网络进行端到端协同优化,为有雾图像中的遮挡目标检测任务提供更可靠的优化路径.实验结果表明,联合优化模型提升了雾天遮挡场景下的目标检测性能,以93.85%的准确率和47.61帧/s的检测速度实现了高效检测,并表现出优异的模型鲁棒性. 展开更多
关键词 被遮挡目标 雾天图像 特征融合 目标检测 特征提取
在线阅读 下载PDF
基于多尺度感知的多维空间融合水下图像增强算法
15
作者 郭伟 王曼婷 曲海成 《计算机应用》 北大核心 2026年第1期224-232,共9页
针对深海拍摄会导致水下图像色彩偏移、对比度过低和结构不清晰等问题,提出一种基于多尺度感知的多维空间融合水下图像增强算法,结合空间、通道和三维特征将图像信息并行传入多维特征提取网络和编码器中。首先,在多维特征提取网络中引... 针对深海拍摄会导致水下图像色彩偏移、对比度过低和结构不清晰等问题,提出一种基于多尺度感知的多维空间融合水下图像增强算法,结合空间、通道和三维特征将图像信息并行传入多维特征提取网络和编码器中。首先,在多维特征提取网络中引入多尺度特征精炼模块进一步处理提取到的特征信息,使网络更准确地学习不同尺度的信息;然后,在编码器中引入多维色彩增强模块,增强图像细节和色彩;最后,设计自适应增强网络来进一步处理特征信息并融合多级信息,再通过解码器得到最终的增强图像。在公开数据集上的实验结果表明,所提算法表现优异,它的峰值信噪比(PSNR)和结构相似性(SSIM)最高分别达到24.8651 dB和0.8954,比混合融合方法(HFM)分别提升了1.5806 dB和0.0398;水下色彩质量评价(UCIQE)和水下图像质量测量(UIQM)最高分别达到0.5931和3.1028,比HFM分别提升了0.0384和0.1514。可见,所提算法能有效提升水下视觉效果。 展开更多
关键词 图像处理 特征提取 多尺度特征 深层卷积 强化色彩
在线阅读 下载PDF
频域空间信息驱动的特征聚合跨模态行人重识别方法
16
作者 金静 朱传斌 翟凤文 《计算机应用研究》 北大核心 2026年第1期298-304,共7页
跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信... 跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信息且忽略了不同尺度特征语义关联性,提出一种基于频域空间信息的特征聚合(FDSIFA)网络。首先,通过设计的多分支频域空间感知模块(MFSPM),对不同模态的增强图像和原始图像充分提取模态特定信息,同时在频域和空间维度上挖掘跨模态特征的一致性,有效减小了模态间的差异;其次,设计了多阶段特征聚合模块(MFAM),自适应聚合不同尺度的特征,挖掘低层次特征与高层次特征之间的语义关联,提升特征的语义表达能力和判别力。该网络在SYSU-MM01数据集的全搜索模式下,rank-1和mAP分别达到了75.09%和71.35%,优于对比方法,实验结果验证了所提方法的有效性。 展开更多
关键词 跨模态 行人重识别 数据增强 频域空间信息 特征聚合
在线阅读 下载PDF
结合增强空间感知的远距离车道线检测方法
17
作者 王耀琦 卢亚琦 王小鹏 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期62-76,共15页
车道线检测作为智能汽车视觉导航系统的核心技术,其性能直接影响到车辆的路径引导与转向控制,对提升交通安全性和导航效率具有重要意义。车道线图像中背景信息往往占据主导地位,特别是远距离车道线存在特征小、标记缺失或被遮挡等问题,... 车道线检测作为智能汽车视觉导航系统的核心技术,其性能直接影响到车辆的路径引导与转向控制,对提升交通安全性和导航效率具有重要意义。车道线图像中背景信息往往占据主导地位,特别是远距离车道线存在特征小、标记缺失或被遮挡等问题,同时伴随视觉上的宽度变化,导致远距离车道线比正常车道线更加难以识别。为解决这一问题,该文提出了结合增强空间感知的车道线检测方法。该方法首先针对车道线在图像中呈细长结构的特点,在主干网络中引入条形池化,以细化车道线信息的表示;然后将增强空间感知优化器(ESAO)和车道线多尺度聚合器(LMSA)相结合,以抑制无关背景和增强远距离车道线特征,进而提高车道线检测的准确性和稳定性;最后,通过全局和局部斜率一致性损失函数自适应调整车道线形状与位置,以保持预测车道线与地面真实情况之间的形状一致性。在2个车道线检测数据集TuSimple和CULane上的实验结果表明,该方法优于对比实验中最优秀的方法,在数据集TuSimple上的F1分数和准确率分别提高0.58和0.19个百分点,在数据集CULane上的F1@50提高1.14个百分点,特别是在远距离道路场景中表现的性能更加稳定。 展开更多
关键词 车道线检测 远距离 条形池化 增强空间感知优化器 车道线多尺度聚合器
在线阅读 下载PDF
基于域对抗的自适应环境运动目标状态检测方法
18
作者 肖刚 吴沛熙 +4 位作者 丁浩南 陈锋 徐雪松 袁牧 程振波 《高技术通讯》 北大核心 2026年第1期67-79,共13页
生物式水质预警系统常将鱼类作为生物指示器,通过自动获取监测箱内鱼目标的行为状态,实现对流经监测箱水体的源水水质预警。然而,在源水杂质、藻类和水垢等长时间的影响下,使用现有的深度学习框架检测监测箱内的鱼目标,其准确性会逐渐... 生物式水质预警系统常将鱼类作为生物指示器,通过自动获取监测箱内鱼目标的行为状态,实现对流经监测箱水体的源水水质预警。然而,在源水杂质、藻类和水垢等长时间的影响下,使用现有的深度学习框架检测监测箱内的鱼目标,其准确性会逐渐下降。为此,本文提出了一种自适应环境鱼目标检测模型,该模型包括前景融合处理模块、域对抗模块以及目标检测模块。前景融合模块将输入图像与其包含的目标轮廓二值图像融合作为模型的输入,域对抗模块中的域分类网络经由梯度反转层来实现对输入图像所处域的分类,目标检测模块通过弱监督来增加不同域下训练数据的标注信息。最后,通过改变监测箱背景构建了5类不同水体环境的数据集并在这些数据集上进行实验,结果表明模型在监测箱水体环境发生变化的情况下,依然能较准确地对鱼目标进行状态分类。 展开更多
关键词 生物水质监测 域适应 目标检测 前景融合
在线阅读 下载PDF
基于特征融合及多尺度上下文提取的实时语义分割
19
作者 刘伯红 刘磊 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对实时语义分割算法常用的双分支结构存在空间分支和上下文分支特征融合不充分、多尺度上下文信息提取不全面等问题,提出基于特征融合及多尺度上下文提取的实时语义分割网络。设计空间-多尺度双向注意力融合模块,使用空间注意力机制... 针对实时语义分割算法常用的双分支结构存在空间分支和上下文分支特征融合不充分、多尺度上下文信息提取不全面等问题,提出基于特征融合及多尺度上下文提取的实时语义分割网络。设计空间-多尺度双向注意力融合模块,使用空间注意力机制和多尺度特征融合模块实现双分支交互融合,促进空间特征以及语义特征在双分支上的流动;在上下文分支末端设计了串联聚合金字塔池化模块,更精确地捕捉细节信息;聚合空间分支不同阶段特征,增强模型对图像特征的全面理解能力,促进深层特征与浅层特征的深度融合;使用多尺度注意力特征融合模块引导空间分支和上下文分支融合。实验结果表明,构建的网络在Cityscapes数据集上平均交并比(mean intersection over union,MIoU)达到78.0%,推理速度为104.5 Frame/s;在CamVid数据集上,MIoU达到75.9%,推理速度为224.6 Frame/s。 展开更多
关键词 实时语义分割 特征融合 注意力机制 多尺度上下文提取
在线阅读 下载PDF
基于可变形卷积和注意力机制的路面裂缝检测
20
作者 谢永华 方育才 彭银佳 《计算机工程与设计》 北大核心 2026年第1期279-285,共7页
为解决路面裂缝检测中图像边缘特征难以学习和背景噪声干扰的问题,提出一个基于可变形卷积和注意力机制的可端到端训练的路面裂缝检测网络。该网络基于U-Net结构设计,在特征融合部分添加边缘感知模块来增强裂缝边缘的检测能力;在编码器... 为解决路面裂缝检测中图像边缘特征难以学习和背景噪声干扰的问题,提出一个基于可变形卷积和注意力机制的可端到端训练的路面裂缝检测网络。该网络基于U-Net结构设计,在特征融合部分添加边缘感知模块来增强裂缝边缘的检测能力;在编码器部分使用空洞残差模块扩大感受野并保留更多细节信息;在解码器部分添加注意力机制提高对裂缝特征的关注度,抑制背景噪声。实验结果表明,该网络在MPA、mIoU和F1值这3项指标上均优于其它对比网络,验证了该网络的有效性。 展开更多
关键词 裂缝检测 语义分割 编码解码 可变形卷积 空洞卷积 残差连接 注意力机制
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部