期刊文献+
共找到258篇文章
< 1 2 13 >
每页显示 20 50 100
融合Vision Transformer与3D CNN的深度伪造视频篡改检测
1
作者 孙立信 吴永飞 +2 位作者 李心宇 任杰煌 刘西林 《计算机应用与软件》 北大核心 2025年第11期121-127,共7页
Deepfake技术的出现,使人们可以轻松地对人脸视频进行篡改,对社会造成巨大的危害。现有的篡改检测方法主要侧重于视频帧间的局部人脸区域空间特征变化检测,并没有考虑连续全局区域的时域特征,且不能检测视频帧中的细微空域特征变化。针... Deepfake技术的出现,使人们可以轻松地对人脸视频进行篡改,对社会造成巨大的危害。现有的篡改检测方法主要侧重于视频帧间的局部人脸区域空间特征变化检测,并没有考虑连续全局区域的时域特征,且不能检测视频帧中的细微空域特征变化。针对此问题,提出融合Vision Transformer和3D CNN的视频篡改检测方法ViT-3DCNN。该方法无需对人脸进行裁剪,直接学习视频帧间的连续时域特征以及每一帧的空间特征。实验结果表明,不依赖于人脸剪裁的情况下,ViT-3DCNN模型分别在DFDC数据集及Celeb-DF数据集上取得了93.3%与90.65%的分类准确性,充分验证了该模型在检测精度和泛化性等方面相较于现有检测方法具有明显的优势。 展开更多
关键词 伪造视频篡改检测 时空特征 vision Transformer 3D卷积
在线阅读 下载PDF
Research on Night Vision System Based on Range-Gated Imaging 被引量:1
2
作者 刘宇 范燕平 +3 位作者 茹志兵 郭城 周新妮 张保民 《Defence Technology(防务技术)》 SCIE EI CAS 2009年第4期287-291,共5页
A design of low-light-level night vision system is described,which can image objects selectively in the specific space. The system can selectively image some objects in specific distances,meanwhile ignore those shelte... A design of low-light-level night vision system is described,which can image objects selectively in the specific space. The system can selectively image some objects in specific distances,meanwhile ignore those shelters on the way of observation by combining an intensifying charge coupled device(ICCD) with a near infrared laser assisted in vision,whose operation wavelength matches with the photocathode of the image tube,and adopting the gated mode and adjustable time-delay. A semiconductor laser diode of 100 W in peak power is chosen for illumination. The laser and the image tube operate in 150 ns pulse width and 2 kHz repeat frequency. Some images of different objects at the different distances within 100 m can be obtained clearly,and even behind a grove by using a sampling circuit and a delay control device at 100 W in peak power of semiconductor laser diode,150 ns in pulse width of laser and image tube,2 kHz in repeat frequency. 展开更多
关键词 electron technology low-light-level night vision ICCD spatial gated range gated
在线阅读 下载PDF
基于多尺度空间-光谱特征提取的颜料高光谱图像分类方法
3
作者 汤斌 罗希玲 +6 位作者 王建旭 范文奇 孙玉宇 刘家路 唐欢 赵雅 钟年丙 《光谱学与光谱分析》 北大核心 2025年第8期2364-2372,共9页
颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能... 颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能为科学修复提供指导依据。然而,传统颜料分析受限于样品尺寸、表面平整度,且部分分析方法需要取样,对文物造成不可逆损伤,这使得古书画颜料的检测面临诸多挑战。高光谱成像技术(HSI)凭借其无损检测、广域扫描及获取完整光谱信息的优势,成为文物颜料分析的重要工具。HSI克服了样品表面不平整、尺寸受限等问题,能够从不同波段获取细致的光谱和空间信息,帮助提取颜料的微观特征。旨在利用HSI技术实现古书画颜料的精准分类与深度特征提取,以应对复杂场景下的颜料检测挑战。为此,我们提出了一种多尺度空间-光谱特征融合的方法,在分析过程中结合不同层次的信息:利用光谱-空间注意力机制捕捉细节特征,并通过视觉转换器(ViT)模型获取图像整体的高层语义信息,从而增强对复杂颜料特征的表示能力和分类性能。实验结果表明,该方法在模拟画作样品上的分类性能显著优于传统和其他深度学习模型:与支持向量机(SVM)相比,分类精度提升了34.35%;相较于HyBridSN与SSRN模型,精度分别提高了8.93%和5.6%。本方法不仅提升了颜料检测的准确性,还为古书画的科学修复和价值保护提供了无损、可靠的技术支持,并为文物保护的智能化发展奠定了技术基础。 展开更多
关键词 高光谱成像 多尺度特征融合 vision Transformer 光谱-空间注意力 颜料分类
在线阅读 下载PDF
基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化 被引量:3
4
作者 王元昊 娄欢欢 +2 位作者 罗红品 付兴兰 李光林 《西南大学学报(自然科学版)》 CAS 北大核心 2025年第2期171-183,共13页
针对果园环境中柑橘果实相互重叠和被枝叶遮挡,导致机器视觉识别柑橘果实与定位目标柑橘空间位置难度较大的问题,提出了一种基于YOLOv8-SAM的改进算法。通过增加BAM(Bottlenet Attention Module)注意力机制提高模型对被遮挡柑橘的识别... 针对果园环境中柑橘果实相互重叠和被枝叶遮挡,导致机器视觉识别柑橘果实与定位目标柑橘空间位置难度较大的问题,提出了一种基于YOLOv8-SAM的改进算法。通过增加BAM(Bottlenet Attention Module)注意力机制提高模型对被遮挡柑橘的识别准确率,运用SAM(Segment Anything Model)算法对被遮挡柑橘轮廓形状进行识别,并运用边缘检测法结合双目立体相机三维稠密深度点云得到被遮挡柑橘有效轮廓边,使用最小二乘法拟合出被遮挡柑橘的完整轮廓以确定目标柑橘果实更精确的空间坐标位置。试验结果表明:该算法可以准确识别并分离目标柑橘果实,同时更精确地定位柑橘果实空间坐标。改进的YOLOv8-SAM算法在果园环境中对被遮挡柑橘果实的识别平均精度达到91.1%,对被遮挡柑橘形心空间坐标的平均定位误差相比传统定位方法减少了16.22 mm,平均果径误差降低了7.99%,可为柑橘采摘机器人对重叠与被遮挡果实的准确识别提供参考。 展开更多
关键词 柑橘采摘 机器视觉 空间定位 轮廓重建 遮挡果实 图像处理
原文传递
New Fusion Approach of Spatial and Channel Attention for Semantic Segmentation of Very High Spatial Resolution Remote Sensing Images
5
作者 Armand Kodjo Atiampo Gokou Hervé Fabrice Diédié 《Open Journal of Applied Sciences》 2024年第2期288-319,共32页
The semantic segmentation of very high spatial resolution remote sensing images is difficult due to the complexity of interpreting the interactions between the objects in the scene. Indeed, effective segmentation requ... The semantic segmentation of very high spatial resolution remote sensing images is difficult due to the complexity of interpreting the interactions between the objects in the scene. Indeed, effective segmentation requires considering spatial local context and long-term dependencies. To address this problem, the proposed approach is inspired by the MAC-UNet network which is an extension of U-Net, densely connected combined with channel attention. The advantages of this solution are as follows: 4) The new model introduces a new attention called propagate attention to build an attention-based encoder. 2) The fusion of multi-scale information is achieved by a weighted linear combination of the attentions whose coefficients are learned during the training phase. 3) Introducing in the decoder, the Spatial-Channel-Global-Local block which is an attention layer that uniquely combines channel attention and spatial attention locally and globally. The performances of the model are evaluated on 2 datasets WHDLD and DLRSD and show results of mean intersection over union (mIoU) index in progress between 1.54% and 10.47% for DLRSD and between 1.04% and 4.37% for WHDLD compared with the most efficient algorithms with attention mechanisms like MAU-Net and transformers like TMNet. 展开更多
关键词 spatial-Channel Attention Super-Token Segmentation Self-Attention vision Transformer
在线阅读 下载PDF
基于改进YOLO v8n的双目视觉自动套杯奶牛乳头空间定位方法
6
作者 王娟 李梦洁 +2 位作者 刘雅举 付鑫培 李斯睿 《农业机械学报》 北大核心 2025年第11期560-571,共12页
奶牛挤奶时人工套杯劳动强度大、生产效率低,而自动套杯成本较高,对中小型养殖场来说存在一定经济负担。为满足中小型养殖场需求,针对挤奶器快速准确自动套杯工作中挤奶环境复杂、奶牛乳头形态各异等问题,本文提出了一种基于改进YOLO v8... 奶牛挤奶时人工套杯劳动强度大、生产效率低,而自动套杯成本较高,对中小型养殖场来说存在一定经济负担。为满足中小型养殖场需求,针对挤奶器快速准确自动套杯工作中挤奶环境复杂、奶牛乳头形态各异等问题,本文提出了一种基于改进YOLO v8n的双目视觉定位新方法,能够实现对奶牛乳头的准确检测和快速定位。将YOLO v8n的CSPDarknet主干网络替换为轻量级的FasterNet主干网络、在颈部网络构建P2特征层、在Detect部分与C2f部分添加EMA注意力机制,提高了模型对奶牛乳头的检测精度与速度。利用RANSAC算法对SURF特征点进行优化,减少了乳头与乳房相似导致的不匹配问题。基于改进YOLO v8n模型,结合双目视觉获取奶牛乳头的三维空间信息。在自制数据集上进行消融试验和对比试验,结果表明,改进YOLO v8n模型的mAP@0.5为98.62%,精确率为97.23%,召回率为96.69%,与原始YOLO v8n模型相比,各项指标分别提高2.17、3.28、3.65个百分点;参数量和帧率分别为原始YOLO v8n模型的0.55、2.31倍,显著提升了模型的检测性能。经统计分析,奶牛乳头定位的平均绝对偏差为0.011 7 m,方差为0.000 1 m^(2),标准差为0.011 9 m,能够满足下一阶段挤奶器自动套杯要求。 展开更多
关键词 奶牛 自动套杯 乳头识别 乳头空间定位 改进YOLO v8n 双目视觉
在线阅读 下载PDF
空间定位与特征泛化增强的铁路异物跟踪检测 被引量:2
7
作者 陈永 王镇 周方春 《北京航空航天大学学报》 北大核心 2025年第1期9-18,共10页
针对现有深度学习异物跟踪检测算法易受复杂环境、目标遮挡等影响,导致出现漏检及检测精度低等问题,提出了一种空间定位与特征泛化增强的铁路异物跟踪检测算法。提出改进多尺度级联GhostNet特征提取网络,提升对红外目标的特征提取能力;... 针对现有深度学习异物跟踪检测算法易受复杂环境、目标遮挡等影响,导致出现漏检及检测精度低等问题,提出了一种空间定位与特征泛化增强的铁路异物跟踪检测算法。提出改进多尺度级联GhostNet特征提取网络,提升对红外目标的特征提取能力;利用异物空间位置定位与泛化形态信息,设计空间定位与特征泛化增强模块,增强对复杂场景下位置移动与跟踪轨迹变化目标的检测精度;构建金字塔预测网络,得到红外铁路异物的检测锚框、类别及置信度信息;通过改进类别和置信度显示的DeepSORT跟踪算法,结合卡尔曼滤波与匈牙利算法实现红外弱光环境下铁路异物跟踪检测。实验结果表明:所提算法对铁路异物的跟踪检测精确度达到83.3%,平均检测速度为11.3帧/s;与比较算法相比,所提算法检测精度更高,对红外弱光场景下铁路异物跟踪检测具有较好的性能。 展开更多
关键词 机器视觉 异物检测 红外弱光 空间定位 特征泛化增强 目标跟踪
原文传递
转体桥梁空间位姿精准监测与实时可视化研究
8
作者 柳蓓 胡景顺 +3 位作者 常柱刚 户东阳 黄方林 王宁波 《铁道科学与工程学报》 北大核心 2025年第8期3545-3555,共11页
对桥梁转体施工过程进行监测是保证转体顺利实施的必要环节。为解决现有转体施工监测方法测量滞后、精度不足的问题,开展基于计算机视觉技术的桥梁空间位姿监测及可视化研究。引入三维正交光标作为桥梁转体运动视觉追踪对象,通过构建正... 对桥梁转体施工过程进行监测是保证转体顺利实施的必要环节。为解决现有转体施工监测方法测量滞后、精度不足的问题,开展基于计算机视觉技术的桥梁空间位姿监测及可视化研究。引入三维正交光标作为桥梁转体运动视觉追踪对象,通过构建正交光标映射机理来量化描述桥梁空间姿态,以光标投影变化规律实时反演转体桥梁运动参数,实现对转体桥梁空间姿态的高精度动态感知。搭建桥梁转体监测数字化系统和可视化平台,以视觉测量参数实时驱动桥梁结构模型进行同步运动,实现桥梁转体全过程的实时动态监测与信息反馈。依托某转体桥梁工程实例开展数值仿真研究,通过光标成像对转体结构的空间转动角度、关键点空间位置、撑脚位移等转体参数进行同步反算。研究结果表明:桥梁转动参数的视觉测量最大误差为0.014°,从捕获图像到数字孪生平台即时信息反馈用时不超过2 s。基于计算机视觉的转体桥梁空间位姿监测及可视化方法在测量精度、监测时效性、经济实用性等方面均具备明显优势,可为桥梁转体施工监测提供理论指导,赋能桥梁结构工程数字孪生建设。 展开更多
关键词 转体桥梁 单目视觉 空间位姿 数字孪生 实时监测
在线阅读 下载PDF
基于机器视觉的金属零件表面缺陷检测研究 被引量:2
9
作者 孙姿姣 罗芳 李阳辉 《清远职业技术学院学报》 2025年第1期42-48,共7页
目前制造业中,金属零件的缺陷问题会导致重大经济损失,主要问题在于零件缺陷小且缺陷位置出现随机,传统人工检测难以区分微小缺陷位置与非缺陷位置,且人力成本高,经济效益低下。针对这一问题,研究提出一种基于机器视觉的金属零件表面缺... 目前制造业中,金属零件的缺陷问题会导致重大经济损失,主要问题在于零件缺陷小且缺陷位置出现随机,传统人工检测难以区分微小缺陷位置与非缺陷位置,且人力成本高,经济效益低下。针对这一问题,研究提出一种基于机器视觉的金属零件表面缺陷检测方法,通过机器视觉检测代替人力劳动,同时采用交互式空间位置注意力模块,解决了金属零件表面的缺陷不明显难以检测的问题,采用对偶局部-全局Transformer模块,解决了缺陷区域与周围正常区域难以区分的问题,提高了金属零件表面微小缺陷的检测性能,从而提高企业经济效益。 展开更多
关键词 机器视觉 缺陷检测 交互式空间位置注意力模块 对偶局部-全局Transformer模块
在线阅读 下载PDF
中国式现代化的空间实践与治理
10
作者 李家丽 《中共云南省委党校学报》 2025年第3期54-62,共9页
中国式现代化是现代化的发展理论与中国国情相结合的实践产物,其形成既是动态的社会转型过程,也是空间现代化的重塑结果。在中国式现代化实践的过程中,中华人民共和国的成立为中国式现代化提供了独立自主的发展空间。在这一背景下,经济... 中国式现代化是现代化的发展理论与中国国情相结合的实践产物,其形成既是动态的社会转型过程,也是空间现代化的重塑结果。在中国式现代化实践的过程中,中华人民共和国的成立为中国式现代化提供了独立自主的发展空间。在这一背景下,经济、政治、文化、社会、生态的“五位一体”总体布局系统地表达了中国式现代化的基本内容。城乡关系是其空间生产结构的核心,而美好社会则是以人民为中心的空间治理现代化的根本目标。中国式现代化的人类情怀与全球视野展现了中国共产党胸怀天下的理念。深入研究中国式现代化的空间实践与治理,是理解中国式现代化的社会主义特色空间结构和历史方位的关键。 展开更多
关键词 中国式现代化 城乡关系 空间正义 空间治理 胸怀天下
在线阅读 下载PDF
基于改进可变形-端到端目标检测模型的竹片缺陷检测方法 被引量:2
11
作者 马良城 徐筱茹 伍希志 《森林工程》 北大核心 2025年第2期349-359,共11页
目前,虽然已经有一些基于图像处理技术的竹片缺陷检测方案,但这些方案检测存在种类较少、实用性较差且难以部署在机器上等缺陷,为此,提出一种改进的竹片缺陷检测模型。该模型为改进的可变形-端到端目标检测(Deformable-DETR)模型,首先... 目前,虽然已经有一些基于图像处理技术的竹片缺陷检测方案,但这些方案检测存在种类较少、实用性较差且难以部署在机器上等缺陷,为此,提出一种改进的竹片缺陷检测模型。该模型为改进的可变形-端到端目标检测(Deformable-DETR)模型,首先将骨干网络替换成由DCNv3卷积为核心而堆叠设计的InternImage,该网络在保留卷积神经网络(CNN)先验特性的情况下还能捕捉到长距离依赖,使提取到的特征空间语义更丰富;然后在特征提取后新增一个采样模块,该采样模块将图像特征抽象为精细的前景特征和少量粗糙的背景特征,不仅能去除冗余的背景特征信息,还能提取高语义前景信息;最后引入一种新颖的协作混合分配训练策略,该策略通过训练由一对多标签分配监督的多个并行辅助头,提高编码器在端到端检测器中的学习能力。此外,使用数据增强来扩展数据集,并使用迁移学习,以增强竹片缺陷的检测。试验结果表明,该改进方法可以提高模型的缺陷特征提取与解析的能力,并在测试数据集上取得了85.7%mAP50(全类平均精确度),单张图片推理时间为0.28 s,检测精度优于其他主流目标检测模型,为竹片缺陷检测提供新的方法。 展开更多
关键词 缺陷检测 深度学习 空间特征采样 协作混合分配训练 计算机视觉
在线阅读 下载PDF
城市街道绿化泛类结构的视觉感知特征——以天津市市内六区为例
12
作者 杨瀚文 邹尚恩 胡一可 《风景园林》 北大核心 2025年第5期37-44,共8页
【目的】绿化资源配置是城市公共空间优化的重要环节之一,对居民生活质量的提升有着积极的作用。城市街道绿化泛类结构(urban street greening general structure,USGGS)能够反映街道绿化在行人视觉环境中的整体特征,研究USGGS聚类对于... 【目的】绿化资源配置是城市公共空间优化的重要环节之一,对居民生活质量的提升有着积极的作用。城市街道绿化泛类结构(urban street greening general structure,USGGS)能够反映街道绿化在行人视觉环境中的整体特征,研究USGGS聚类对于物质空间要素数量以及物质空间形态的改变,能够有效探究街道绿化对行人视觉感知水平的影响。【方法】采用百度街景数据,利用DeepLabV3+神经网络模型,对天津市市内六区街道的物质空间要素进行分割,使用ArcGIS软件对空间分布特征进行可视化处理,结合数理统计分析结果,探讨USGGS与行人视觉感知之间的关系。【结果】USGGS聚类呈现向心聚集型的空间分布特征,城市主干道及快速路的行人视觉感知空间分布特征较为同质化,空间异质化现象集中出现在街道断面狭窄的生活型街道以及商业型街道。不同聚类的USGGS不仅对行人视觉感知有不同程度的影响,也与场所属性以及绿化空间位置密切相关。【结论】提升城市街道环境质量需要考虑行人视觉感知水平。合理的USGGS配置以及适当的种植点位能够更好地适应周围场所的属性,促进城市公共空间与城市街道绿化的有机融合,助推城市更新工作的精细化管理,提升城市人居环境质量。 展开更多
关键词 风景园林 计算机视觉 城市街道 绿化结构 视觉感知 空间异质性
在线阅读 下载PDF
融合多尺度特征的时空Transformer目标跟踪方法
13
作者 苏健 李志青 《南京邮电大学学报(自然科学版)》 北大核心 2025年第6期77-86,共10页
大多数基于Transformer的目标跟踪方法未充分利用视频序列中的时空上下文线索,导致对目标外观变化的感知能力不足。为解决这一问题,提出一种融合多尺度特征的时空Transformer目标跟踪方法。首先,采用多尺度特征提取模块融合深层与浅层... 大多数基于Transformer的目标跟踪方法未充分利用视频序列中的时空上下文线索,导致对目标外观变化的感知能力不足。为解决这一问题,提出一种融合多尺度特征的时空Transformer目标跟踪方法。首先,采用多尺度特征提取模块融合深层与浅层特征细节。随后,构建时空Transformer编解码器实现自适应外观变化学习:编码器通过空间残差注意力提取空间信息,解码器对连续帧的目标状态进行时间建模。最后,采用角点预测头估计目标边界框,并通过动态更新策略优化模板。实验结果表明,所提方法具备良好跟踪性能,在外观变化场景下展现出较强的鲁棒性。 展开更多
关键词 时空Transformer 特征融合 空间残差注意力 目标跟踪 计算机视觉
在线阅读 下载PDF
结合多尺度特征和细节感知策略的遥感图像场景分类模型
14
作者 马惠 霍然 《计算机系统应用》 2025年第8期252-263,共12页
针对遥感图像场景分类中存在的场景尺度多变性、类内多样性和类间相似性,以及有标签训练样本稀缺的问题,本文提出了一种结合多尺度特征和细节感知策略的Vision Transformer(ViT)模型用于遥感图像场景分类.该模型通过引入空洞空间金字塔... 针对遥感图像场景分类中存在的场景尺度多变性、类内多样性和类间相似性,以及有标签训练样本稀缺的问题,本文提出了一种结合多尺度特征和细节感知策略的Vision Transformer(ViT)模型用于遥感图像场景分类.该模型通过引入空洞空间金字塔池化模块,有效捕捉并融合了遥感图像中的多尺度特征,同时增强了对局部特征信息的利用,从而进一步提升了特征判别能力.另外,采用创新的细节感知掩码策略,使得模型能够有效利用无标签遥感图像数据,促进模型学习到更为精细的特征表示,以实现更高效、更准确的遥感图像场景分类.在实验部分,本文首先在大规模无标签遥感图像数据集上进行预训练,随后将预训练模型迁移至下游场景分类任务中进行微调.在多个公开遥感图像数据集上的实验结果表明,所提模型在自监督预训练阶段能够有效提取图像特征,并在下游场景分类任务中实现较高的准确率,展现出良好的鲁棒性和有效性. 展开更多
关键词 多尺度特征 细节感知策略 遥感图像场景分类 空洞空间金字塔池化 vision Transformer(ViT)
在线阅读 下载PDF
一种基于空间频率优化的各向异性轮廓检测方法
15
作者 唐浩然 蔡哲飞 +1 位作者 范影乐 武薇 《传感技术学报》 北大核心 2025年第4期623-633,共11页
基于空间频率对朝向差别的调制机制,提出了一种空间频率调制下的生物视觉轮廓检测方法。首先引入了MCI轮廓检测模型,对图像进行初级轮廓提取和多特征外周抑制计算;然后基于视觉细胞对空间频率敏感的生理学机制,构建了面向轮廓检测的多... 基于空间频率对朝向差别的调制机制,提出了一种空间频率调制下的生物视觉轮廓检测方法。首先引入了MCI轮廓检测模型,对图像进行初级轮廓提取和多特征外周抑制计算;然后基于视觉细胞对空间频率敏感的生理学机制,构建了面向轮廓检测的多层空间频率探测模型:引入基于神经元树突的多方向空间频率感知、基于异常值剔除的空间频率筛选、基于神经元纵向排列的多级纹理信息整合等步骤,提升了空间频率探测的准确性与鲁棒性;最后引入二分类精确度指标调制朝向选择性抑制权重以实现图像的显著轮廓提取。分别用P指标和F指标评价RuG40和BSDS300数据库的检测轮廓,结果分别为0.63与0.76,相较于原MCI方法提高了37%和16%,表明模型能弥补朝向差别在纹理检测方面的不足,有效提高图像质量。 展开更多
关键词 生物视觉 轮廓检测 朝向特征优化 空间频率调制
在线阅读 下载PDF
基于卷积混合注意力机制的多目标跟踪算法 被引量:1
16
作者 郭崇 刘晟 +1 位作者 张文波 朱宏博 《控制与决策》 北大核心 2025年第4期1127-1135,共9页
基于检测的多目标跟踪方法在复杂场景问题上达到了较好的效果,但已有研究大多关注于时空特征关联而忽视了提高检测性能所能带来的全局跟踪收益.据此,提出一种卷积混合注意力机制,该模块结合动态稀疏通道注意力和空间位置注意力:在处理... 基于检测的多目标跟踪方法在复杂场景问题上达到了较好的效果,但已有研究大多关注于时空特征关联而忽视了提高检测性能所能带来的全局跟踪收益.据此,提出一种卷积混合注意力机制,该模块结合动态稀疏通道注意力和空间位置注意力:在处理通道注意力时,整合空间上下文信息,动态调整通道权重;在处理空间注意力时,结合不同通道特征评估空间区域的重要性,旨在优化注意力分配并提升检测精度.进一步地,提出一种两阶段多目标跟踪方法——CHAMTrack,通过在运动目标检测阶段使用该注意力机制,增强算法在复杂场景中对关键信息的捕捉能力,提升不同尺度目标的跟踪效果,降低跟踪过程中漏检和ID切换的发生率.在MOT17和MOT20数据集上的实验结果表明,CHAMTrack在MOTA指标上分别提升28%和20.5%,显著提升了多目标跟踪算法在复杂场景中的效果和鲁棒性. 展开更多
关键词 计算机视觉 多目标跟踪 特征增强 通道注意力机制 空间注意力机制 卷积混合注意力机制
原文传递
基于双域特征融合的图像去雾网络
17
作者 王炜嘉 陈飞 +2 位作者 刘莞玲 程航 王美清 《中国图象图形学报》 北大核心 2025年第11期3665-3679,共15页
目的图像去雾旨在从有雾图像中恢复潜在的无雾图像。现有方法利用清晰/退化图像对在空间域和频率域的差异进行去雾并取得一定的效果,但是仍存在3个主要问题:空间域特征提取与融合存在局限性、频率域特征融合效果不佳以及未能实现频空双... 目的图像去雾旨在从有雾图像中恢复潜在的无雾图像。现有方法利用清晰/退化图像对在空间域和频率域的差异进行去雾并取得一定的效果,但是仍存在3个主要问题:空间域特征提取与融合存在局限性、频率域特征融合效果不佳以及未能实现频空双域特征的高效融合。针对这些问题,提出专注于频空双域特征融合的双域特征融合网络(dual-domain feature fusion network,DFFNet)。方法首先,设计更适合图像软重建的空间域特征融合模块(spatial-domain feature fusion module,SFFM),采用Transformer风格架构,通过大核注意力机制捕获全局特征并定位有雾区域,像素注意力机制建模局部特征并恢复边缘和细节,共同模拟多头自注意力机制,满足软重建需求。同时,提出频率域特征融合模块(frequency-domain feature fusion module,FFFM)。该模块采用隐式方法处理高频信息,通过多个卷积层增强高频分量、多分支通道注意力实现频率高效融合,并放置于网络瓶颈处实现频空双域特征高效融合。结果结合这两种关键模块设计提出的DFFNet在两个基准数据集上展现出超越目前先进方法的性能表现。DFFNet-L是第1个在室内合成目标测试集(synthetic objective testing set-indoor,SOTS-Indoor)上峰值信噪比(peak signal-to-noise ratio,PSNR)超过43 dB以及第1个在Haze4K数据集上PSNR超过36 dB的去雾网络,PSNR分别为43.83 dB和36.39 dB,分别领先领域先进方法MixDehazeNet-L 1.21 dB和0.45 dB。并且DFFNet更加轻量级,参数量仅为MixDehazeNet-L的46.0%,浮点运算次数仅为其67.1%,同时,由于DFFNet的主要模块SFFM和FFFM具有良好的可迁移性和扩展性,这使得它们能够便捷地迁移到其他计算机视觉任务中,为提升模型性能提供新的解决方案。结论本文所提出的双域特征融合网络,综合了卷积神经网络模型和Transformer模型的优点,有效解决了双域特征融合存在的问题,取得了卓越的去雾效果。代码发布于https://github.com/WWJ0720/DFFNet。 展开更多
关键词 计算机视觉 图像去雾 双域特征融合 空间域特征融合 频率域特征融合 注意力机制 深度学习
原文传递
交通仿真中驾驶人空间视野感知模型 被引量:11
18
作者 张驰 杨少伟 +1 位作者 潘兵宏 赵一飞 《交通运输工程学报》 EI CSCD 北大核心 2010年第4期115-120,共6页
分析了驾驶人视野注视点的移动规律,研究了空间视野范围内的视野水平角,给出了车速与视野和注视距离的关系,提出了空间视野感知模型。结合道路中心线与平行线三维坐标计算方程,建立了驾驶人空间视野感知模型的计算方法。通过计算机模拟... 分析了驾驶人视野注视点的移动规律,研究了空间视野范围内的视野水平角,给出了车速与视野和注视距离的关系,提出了空间视野感知模型。结合道路中心线与平行线三维坐标计算方程,建立了驾驶人空间视野感知模型的计算方法。通过计算机模拟实际场景,对5位受试者分别进行了4次测试,得到了722段组合数据和3585个速度数据,对模型进行了验证。研究结果表明:预测结果与实测结果吻合率大于70%,不明显效果率低于20%,错误效果率低于10%。该模型仿真效果明显,算法易于实现。 展开更多
关键词 交通仿真 空间视野 感知模型 视野注视点
原文传递
空间圆几何参数的非接触高精度测量方法 被引量:29
19
作者 周富强 张广军 江洁 《仪器仪表学报》 EI CAS CSCD 北大核心 2004年第5期604-607,共4页
分析了空间圆透视投影的数学模型 ,并建立了点的空间三坐标立体视觉测量数学模型。提出了一种基于立体视觉的空间圆几何参数的非接触测量方法 ,根据极线约束求出空间圆在双目立体视觉中的对应匹配点 ,后投影到三维空间求出边缘的实际坐... 分析了空间圆透视投影的数学模型 ,并建立了点的空间三坐标立体视觉测量数学模型。提出了一种基于立体视觉的空间圆几何参数的非接触测量方法 ,根据极线约束求出空间圆在双目立体视觉中的对应匹配点 ,后投影到三维空间求出边缘的实际坐标 ,采用基于空间三维圆最优拟合求取空间圆的几何中心的三维空间坐标和圆半径等几何参数。该方法减小了空间圆透视投影形状畸变引起的测量误差 。 展开更多
关键词 透视投影 双目立体视觉 极线约束 非接触测量 三维空间 最优 边缘 几何参数 圆半径 高精度测量
在线阅读 下载PDF
改进ST-GCN的人体跌倒检测
20
作者 王世刚 邓珍妮 饶淼淼 《计算机系统应用》 2025年第8期159-168,共10页
针对ST-GCN算法在动作识别中需要预先定义人体骨架拓扑图及准确率有待提高等问题,提出了基于OpenPose与改进ST-GCN结合的跌倒检测算法.利用OpenPose算法提取人体骨骼关键点数据,将骨骼关键点数据输入改进的ST-GCN算法中进行动作识别.对S... 针对ST-GCN算法在动作识别中需要预先定义人体骨架拓扑图及准确率有待提高等问题,提出了基于OpenPose与改进ST-GCN结合的跌倒检测算法.利用OpenPose算法提取人体骨骼关键点数据,将骨骼关键点数据输入改进的ST-GCN算法中进行动作识别.对ST-GCN算法进行改进,引入自适应图卷积模块,通过动态调整图结构,增强模型对不同动作类型特征提取的灵活性;引入注意力机制模块,进一步提升模型的识别性能.在公开数据集上验证的结果显示,NTU-RGB+D 60数据集上,X-Sub和X-View的top-1准确率与改进前相比分别提高2.2%和2.5%;Kinetics-Skeleton数据集上,top-1和top-5准确率分别提高3.1%和4%.自建数据集上的准确率与改进前相比提高4.7%.实验结果表明,所提出的算法满足实际应用需求. 展开更多
关键词 时空图卷积 人体姿态估计 跌倒检测 计算机视觉
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部