期刊文献+
共找到325篇文章
< 1 2 17 >
每页显示 20 50 100
Effects of scenery frame on visual depth perception in classical Chinese gardens:A case study of the Lvyin Pavilion in Lingering Garden
1
作者 Haipeng Zhu Yuhang Kong +2 位作者 Hong Zhang Zongchao Gu Ryuzo Ohno 《Frontiers of Architectural Research》 2025年第2期402-415,共14页
Visual depth(distance)perception is a fundamental aspect of environmental cognition,as it allows people to judge the spatial scale of their surroundings.However,estimating the depth of classical Chinese gardens is cha... Visual depth(distance)perception is a fundamental aspect of environmental cognition,as it allows people to judge the spatial scale of their surroundings.However,estimating the depth of classical Chinese gardens is challenging,especially from static viewpoints that frame the scenery.Previous studies have examined how the internal components of the scenery frame affect depth perception.Still,the role of the frame and its peripheral information as environmental background have been largely overlooked.This study investigates how depth perception at viewpoints is influenced by viewing position displacement,frame geometry,and environmental context.The authors created nine stimulus materials in a cave virtual reality environment(three image treatments×three positions).Seventy-one participants were asked to evaluate depth perception using the magnitude estimation and adjustment methods.Their eye movement behavior was also recorded using an eye-movement instrument(SensoMotoric Instruments(SMI)eye-tracking glasses,120 Hz).The results showed that participants could perceive spatial depth differences between viewing positions even when the internal viewpoint displacement was small;frame shape did not significantly affect depth perception and gaze behavior;and peripheral visual information of the frame enhanced depth perception significantly.Moreover,the form of the environmental background,especially the position of the scenery window,strongly guided the participants'gaze.These findings suggest that ambient visual information significantly impacts environmental experience,which landscape designers should consider. 展开更多
关键词 Landscape design visual depth perception FRAME Ambient visual information VR experiment Eye-tracking technology Lvyin Pavilion of Lingering Garden China
原文传递
基于图像关键帧的Visual-Depth Map建立方法 被引量:1
2
作者 马琳 杨浩 +1 位作者 谭学治 冯冠元 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2018年第11期23-31,共9页
对于室内视觉定位系统,需要在离线阶段建立Visual Map数据库用来存储图像信息,在线阶段用户通过与Visual Map数据库进行比对来完成用户位置的估计.离线阶段建立的数据库可以采用逐点采样或视频流采样的方式.但是无论何种方式,考虑到数... 对于室内视觉定位系统,需要在离线阶段建立Visual Map数据库用来存储图像信息,在线阶段用户通过与Visual Map数据库进行比对来完成用户位置的估计.离线阶段建立的数据库可以采用逐点采样或视频流采样的方式.但是无论何种方式,考虑到数据库中图像信息的相似性,传统方式建立的数据库中存储图像有较多冗余,导致增加了在线阶段的定位时间开销.因此,本文根据Visual Map中的相邻图像间的相似性,提出了一种基于图像关键帧的Visual-Depth Map建立方法,有效地减少了离线数据库的规模.在离线阶段,本文使用Kinect传感器同时获得图像信息和深度信息;然后,通过基于图像相似度的图像关键帧算法对原始图像序列进行筛选,得到关键帧序列,从而实现Visual-Depth Map的建立.在线阶段,用户可以直接输入查询图像与Visual-Depth Map中的图像序列进行检索匹配,找到相似度较高的匹配图像,再通过EPnP算法进行2D-3D的位姿估计,完成用户位置的计算.实验证明,本文所提方法可以在保证较高定位精度的前提下,有效减少离线数据库规模,降低在线阶段的定位时间开销. 展开更多
关键词 室内定位系统 视觉定位 visual-depth MAP 关键帧
在线阅读 下载PDF
动态场景下基于跨域掩膜分割的视觉SLAM算法
3
作者 亢洁 徐婷 +4 位作者 王佳乐 郭进 赫轩 王沫 夏宇 《陕西科技大学学报》 北大核心 2026年第1期178-185,193,共9页
针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减... 针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减除法实现运动物体检测,利用深度图结合深度阈值分割构建跨域掩膜分割机制,并设计相机运动几何校正策略补偿检测框坐标误差,在实现运动物体分割的同时提升处理速度.为优化特征点利用率,采用金字塔光流对动态特征点进行帧间连续跟踪与更新,同时确保仅由静态特征点参与位姿估计过程.在TUM数据集上进行系统性评估,实验结果表明,相比于ORB-SLAM3算法,该算法的绝对位姿误差平均降幅达97.1%,与使用深度学习分割网络的DynaSLAM和DS-SLAM的动态SLAM算法相比,其单帧跟踪时间大幅减少,在精度与效率之间实现了更好的平衡. 展开更多
关键词 视觉SLAM 动态场景 YOLO-Fastest 金字塔光流 深度阈值分割
在线阅读 下载PDF
基于Depth-wise卷积和视觉Transformer的图像分类模型 被引量:8
4
作者 张峰 黄仕鑫 +1 位作者 花强 董春茹 《计算机科学》 CSCD 北大核心 2024年第2期196-204,共9页
图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关... 图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息。此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高。为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出了一种基于Depth-wise卷积的视觉Transformer(Efficient Pyramid Vision Transformer,EPVT)模型。EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息。EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和“+卷积前馈神经网络(Convolution Feed-forward Network,CFFN)。LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量。在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力。 展开更多
关键词 深度学习 图像分类 depth-wise卷积 视觉Transformer 注意力机制
在线阅读 下载PDF
利用Tilt-depth求取埋藏深度及其与边界位置的关系研究 被引量:4
5
作者 郭华 王平 谢汝宽 《地球物理学进展》 CSCD 北大核心 2012年第5期2151-2159,共9页
对斜导数方法理论进行了研究,编写了利用斜导数方法来提取异常体边界和利用Tilt-depth方法来确定异常体顶面埋深的MATLAB程序,并实现了MATLAB与C#的混合编程.另外对深度点的三维可视化显示进行了研究,显示效果理想.理论模型试算结果表明... 对斜导数方法理论进行了研究,编写了利用斜导数方法来提取异常体边界和利用Tilt-depth方法来确定异常体顶面埋深的MATLAB程序,并实现了MATLAB与C#的混合编程.另外对深度点的三维可视化显示进行了研究,显示效果理想.理论模型试算结果表明,斜导数方法能够有效圈定异常体的边界,对异常体的顶面埋深计算较准确.实际资料的试算也取得了理想的结果,表明该方法具有良好的应用前景. 展开更多
关键词 斜导数 Tilt-depth 顶面埋深 混合编程 三维可视化
在线阅读 下载PDF
检测环境对建筑结构全景测量精度影响研究
6
作者 赵于博 刘永成 +2 位作者 马相楠 姚远宏 张泽雨 《天津建设科技》 2026年第1期52-56,共5页
为了总结出适合建筑结构检测的工作环境,采用全景相机对空间静态场景信息进行采集,基于计算机视觉算法重建三维场景及深度信息,分别研究不同照度值、空间距离、空间遮挡及图像像素对空间尺寸测量结果影响,总结出适合全景测量的工作环境... 为了总结出适合建筑结构检测的工作环境,采用全景相机对空间静态场景信息进行采集,基于计算机视觉算法重建三维场景及深度信息,分别研究不同照度值、空间距离、空间遮挡及图像像素对空间尺寸测量结果影响,总结出适合全景测量的工作环境为顺光环境下照度在50~250 lx之间,全景设备与被测物体之间距离≯4 m且无遮挡。 展开更多
关键词 全景测量 视觉深度算法 测量误差 建筑结构 检测环境
在线阅读 下载PDF
视野盲区几何机制对西方规则式园林的影响
7
作者 卓荻雅 朱建宁 《风景园林》 北大核心 2026年第1期117-123,共7页
【目的】为深化对历史园林设计内涵的理解,系统揭示并量化长期被忽略的近端视野盲区现象,诠释其与西方规则式园林空间营建的内在联系。【方法】基于视锥模型,梳理近端视野盲区现象的几何机制并提炼衡量参数,运用于梵蒂冈望景楼花园空间... 【目的】为深化对历史园林设计内涵的理解,系统揭示并量化长期被忽略的近端视野盲区现象,诠释其与西方规则式园林空间营建的内在联系。【方法】基于视锥模型,梳理近端视野盲区现象的几何机制并提炼衡量参数,运用于梵蒂冈望景楼花园空间的视觉呈现分析,提取该现象造成的感知影响;结合意大利法尔奈斯庄园和法国丢勒里花园的对比分析,提炼西方规则式园林空间营建的共性策略。【结果】近端视野盲区现象对西方规则式园林的景象感知主要影响体现在3个方面:景象认知进深压缩、单元景致视觉截断和近远空间视觉分离。对应的设计策略分别为隐藏功能性空间、凸显特色造景要素和强化观景层次。【结论】基于该现象解析提出的近端吞没进深分析法,可更准确地识读园林物质空间的视觉呈现,为深入探析运用视觉原理的园林营建策略提供了定量工具。 展开更多
关键词 风景园林 西方园林 几何视觉原理 视觉感知 量化分析 模拟分析 进深 设计策略
在线阅读 下载PDF
人工晶状体Alpha角对连续视程人工晶状体眼视觉质量的影响
8
作者 刘振 周维维 +3 位作者 刘涵婧 张艺 朱玉广 朱艳 《山东大学耳鼻喉眼学报》 2026年第1期47-53,共7页
目的探讨IOL Alpha角对连续视程人工晶体(extended depth-of-field intraocular lens,EDOF IOL)植入术后视觉质量的影响。方法选取行白内障超声乳化联合EDOF IOLs植入术的年龄相关性白内障患者50例(50只眼)。采用OPD-ScanⅢ像差分析仪的... 目的探讨IOL Alpha角对连续视程人工晶体(extended depth-of-field intraocular lens,EDOF IOL)植入术后视觉质量的影响。方法选取行白内障超声乳化联合EDOF IOLs植入术的年龄相关性白内障患者50例(50只眼)。采用OPD-ScanⅢ像差分析仪的日-夜瞳孔测量系统,得到人工晶状体(intraocular len,IOL)植入术后Alpha角,根据光学路径差扫描仪Ⅲ(Optical Path Difference ScanⅢ,OPD ScanⅢ)测量术后IOL Alpha角大小分为3组:A组19只眼(0 mm<Alpha角≤0.2 mm),B组19只眼(0.2 mm<Alpha角≤0.4 mm),C组12只眼(Alpha角>0.4 mm)。采用OPD-ScanⅢ像差分析仪检测术前Alpha角;术后3个月检测裸眼远视力(uncorrected distance visual acuity,UDVA),OPD-ScanⅢ测量EDOF IOLs植入眼的客观视觉质量,包括眼内高阶像差(higher-order aberrations,HOA)、斯特列尔比(strehl ratio,SR)、全眼HOA、彗差(Coma)、三叶草像差(Trefoil)并进行比较分析。采用视功能指数量表-14(visual function index,VF-14)评估患者的视功能。结果术前Alpha角与IOL Alpha角差异不具有统计学意义(t=0.11,P=0.915)。经Pearson相关性分析,术前Alpha角与IOL Alpha角之间呈正相关(r=0.983,P<0.001)。IOL Alpha角三组间UDVA、眼内HOA、SR、全眼HOA、Coma、Trefoil差异都具有统计学意义(P均<0.05)。眼内HOA、SR值及Coma值组间两两比较均有统计学差异(P均<0.05);Trefoil值及全眼HOA值仅在A组与C组之间差异具有统计学意义(P=0.030,P=0.001)。VF-14问卷调查显示A、B、C组眩光或光晕的发病率分别为47.4%(9/19)、68.4%(13/19)和100%(12/12),差异具有统计学意义(χ^(2)=9.365,P=0.009)。结论IOL Alpha角可反映IOL居中性及在眼内的实际状态,其不仅影响术后患者视觉质量、反映其术后实际视觉效果,较大的IOL Alpha角还会增加术后眩光、光晕发生率,进而影响患者生活质量。 展开更多
关键词 Alpha角 光学路径差扫描仪Ⅲ 连续视程人工晶体 视觉质量
原文传递
Association between Anisometropia as Well as Visual Acuity, Aniseikonia, and Stereopsis in the Absence of Strabismus
9
作者 David Tayah Marcelo Tannous +1 位作者 Youssef Sabba Tayah Milton Ruiz Alves 《Open Journal of Ophthalmology》 2022年第2期129-141,共13页
Objective: The current study aimed to assess the association between the type of anisometropia and its effects on monocular and binocular best-corrected vision acuity (BCVA), aniseikonia, and stereopsis in the absence... Objective: The current study aimed to assess the association between the type of anisometropia and its effects on monocular and binocular best-corrected vision acuity (BCVA), aniseikonia, and stereopsis in the absence of strabismus. Methods: In total, 162 individuals with anisometropia and healthy eyes and without a previous history of amblyopia therapy and eye surgery were included in the analysis. According to spherical and cylindrical components and spherical equivalent, they were divided into the spherical hyperopic anisometropia (SHA, n = 31), spherical myopic anisometropia (SMA, n = 45), astigmatic or cylindrical hyperopic anisometropia (CHA, n = 22), and astigmatic or cylindrical myopic anisometropia (CMA, n = 64) groups. Patients without anisometropia (NA, n = 188) were classified under the control group. The effects of anisometropia on monocular and binocular BCVA, aniseikonia, and stereoacuity were examined. Results: The NA group had a significantly lower LogMAR of BCVA of the right eye (RE), left eye (LE), worse eye than the SHA, SMA, CMA, and CHA groups. Moreover, the SMA group had significantly lower LogMAR of BCVA than the CHA group (p Conclusion: Worse visual levels of the RE, LE, worse eye, BCVA difference, and lower stereopsis were evidenced in each type of anisometropia defined in this study. Cylindrical hyperopic anisometropia (CHA) resulted in a statically significant worsening VA level and stereopsis than cylindrical myopic (CMA) or spherical myopic anisometropia. 展开更多
关键词 ANISOMETROPIA visual Acuity Aniseiconia STEREOACUITY depth Perception
暂未订购
基于脑电信号的虚拟现实界面布局深度感知认知负荷研究 被引量:3
10
作者 王连彬 殷晓晨 +2 位作者 周涵 刘成龙 孟欣怡 《包装工程》 北大核心 2025年第2期71-81,共11页
目的 通过脑电信号的时频特征分析,探究视觉深度线索对虚拟现实菜单界面布局审美感知的影响。方法 从认知负荷角度出发,运用认知神经美学理论及生理数据采集手段,通过AB对比实验佐证视觉深度线索对虚拟现实菜单界面布局审美感知的影响... 目的 通过脑电信号的时频特征分析,探究视觉深度线索对虚拟现实菜单界面布局审美感知的影响。方法 从认知负荷角度出发,运用认知神经美学理论及生理数据采集手段,通过AB对比实验佐证视觉深度线索对虚拟现实菜单界面布局审美感知的影响。将被试在2组实验下执行相同交互任务的任务态脑电信号(EEG)数据进行时频分析,并将θ、α、β频段的神经震荡节律作为脑电分析指标,通过配对样本t检验分析比较被试在2组不同界面布局形式下的脑电信号时频特征是否具有统计学差异。结果 被试在融入视觉深度线索的虚拟现实菜单界面布局实验中,θ频段在前额叶区(FP1、FP2电极)、α频段在枕叶区(PO7、PO8电极)、β频段在顶叶区(P3、PZ、P4电极)的组平均功率显著低于Web式虚拟现实菜单界面布局实验中相同脑区的组平均功率(P<0.05)。结论 θ、α、β频段相关脑区的组平均功率降低可能由于融入视觉深度线索的虚拟现实菜单界面布局认知负荷降低的影响所致。 展开更多
关键词 认知神经美学 虚拟现实界面 EEG 深度视觉线索 时频分析
在线阅读 下载PDF
基于示踪指示剂的混凝土裂缝深度雷达检测及其性能研究
11
作者 田辉 汤雷 +4 位作者 李坡 贾宇 王玉磊 栾品之 张盛行 《水电能源科学》 北大核心 2025年第1期57-60,29,共5页
裂缝识别检测在结构健康监测中具有重要意义,对评估工程结构的安全性至关重要。然而,准确检测裂缝深度是一项极具挑战性的任务。对此,提出一种基于混凝土裂缝深度指示剂的雷达可视化检测方法,通过将裂缝空腔检测转化为指示剂检测,实现... 裂缝识别检测在结构健康监测中具有重要意义,对评估工程结构的安全性至关重要。然而,准确检测裂缝深度是一项极具挑战性的任务。对此,提出一种基于混凝土裂缝深度指示剂的雷达可视化检测方法,通过将裂缝空腔检测转化为指示剂检测,实现了裂缝深度的精确识别。研究中配置了一种含有纳米Fe_3O_4强反射成分的裂缝深度指示剂,并构建了大体积沙箱相似物理模型,模拟了指示剂灌入裂缝尖端后的效果,开展了多工况检测试验。结果表明,新型指示剂可检测裂缝的最大深度为90 cm,且随着深度增加,指示误差增大,但最大指示误差不超过5%。相较于传统指示剂,新型指示剂显著提高了裂缝深度的检测能力。 展开更多
关键词 指示剂 雷达波 指示性能 沙箱模型 指示误差 裂缝深度 可视化
原文传递
基于双目-惯性-深度融合的船舶清洗ROV定位系统
12
作者 班慧军 武建国 +2 位作者 王晓鸣 梁胜国 孙通帅 《舰船科学技术》 北大核心 2025年第19期94-98,共5页
为了提高视觉惯性里程计在船舶清洗机器人上的定位精度,提出一种融合了双目相机、惯性测量单元和深度传感器的水下定位系统。首先,使用基于灰度世界的白平衡算法与暗通道先验算法对双目图像进行预处理,恢复水下图像真实色彩并进行去雾操... 为了提高视觉惯性里程计在船舶清洗机器人上的定位精度,提出一种融合了双目相机、惯性测量单元和深度传感器的水下定位系统。首先,使用基于灰度世界的白平衡算法与暗通道先验算法对双目图像进行预处理,恢复水下图像真实色彩并进行去雾操作,提高特征提取与匹配精度;然后建立深度传感器数学模型,并将深度数据与视觉关键帧进行对齐,从而在视觉惯性联合优化中加入深度约束,获得高精度位姿估计。试验结果表明,相比于ORB-SLAM3-VIO,本文所提双目-惯性-深度里程计的平均均方根误差减小了41.6%。 展开更多
关键词 船舶清洗ROV 水下定位 双目-惯性-深度里程计 图像恢复 联合优化
在线阅读 下载PDF
图像信息输入下的软线重构与抓取验证
13
作者 邱介禄 王明明 《智能系统学报》 北大核心 2025年第2期435-444,共10页
针对使用机器人对柔性物体进行操作的复杂任务,设计了一种简洁高效的软线抓取方法。首先利用双目相机和图像处理方法对软线进行测量,结合坐标系间的转换关系,从图像中还原了其特征点的空间坐标信息;采用Frenet标架对软线进行了建模重构... 针对使用机器人对柔性物体进行操作的复杂任务,设计了一种简洁高效的软线抓取方法。首先利用双目相机和图像处理方法对软线进行测量,结合坐标系间的转换关系,从图像中还原了其特征点的空间坐标信息;采用Frenet标架对软线进行了建模重构,以获取软线上任意点的位置与弯曲方向信息;提出了六自由度机械臂的位姿表示及转换方法以及相机的标定流程,将曲线任意弧长处的坐标值和Frenet标架方向转换为夹爪末端的位姿参数,最后开展了目标点处沿软线弯曲方向抓取软线的地面实验,验证了方法的有效性。 展开更多
关键词 软线 视觉感知 深度相机 图像处理 坐标计算 曲线重构 位姿转换 机械臂抓取
在线阅读 下载PDF
视听融合耦合坐标自注意的单目深度估计
14
作者 马存良 蒲江川 +2 位作者 许春冬 易见兵 嘉明珍 《计算机辅助设计与图形学学报》 北大核心 2025年第2期265-276,共12页
针对单目图片和声音回波信号都含空间信息这一特点,提出一种视听融合的单目深度估计方法.首先,通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值;然后,采用卷积神经网络和Transformer相结合的方法对单目图片... 针对单目图片和声音回波信号都含空间信息这一特点,提出一种视听融合的单目深度估计方法.首先,通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值;然后,采用卷积神经网络和Transformer相结合的方法对单目图片进行编码,改进坐标注意力提出坐标自注意力模块对图片特征解码获得离散深度值的概率分布;最后,将像素点的深度值建模为离散深度值的期望来构建最终深度图.实验结果表明,在仿真数据集Replica和Matterport3D数据集上,所提方法的均方根误差分别为0.204和0.875,相对误差分别为0.095和0.161,均取得具有竞争力的结果;在真实数据和含噪声数据中,该方法能够应用于真实场景的深度估计. 展开更多
关键词 单目深度估计 视听融合 池化金字塔模块 自注意力
在线阅读 下载PDF
基于旅游体验深度的视障者旅游出行障碍研究
15
作者 刘爱静 孙文平 魏文忠 《山东商业职业技术学院学报》 2025年第6期21-25,共5页
旅游是残障者实现幸福感的重要途径,然而,目前大量的视障者无法实现旅游愿望。通过深度访谈进行定性研究,采用滚雪球的抽样方式对22名视障者进行访谈,并运用内容分析法对访谈资料进行了分析。研究提出,视障者外出旅游体验可分为深度、... 旅游是残障者实现幸福感的重要途径,然而,目前大量的视障者无法实现旅游愿望。通过深度访谈进行定性研究,采用滚雪球的抽样方式对22名视障者进行访谈,并运用内容分析法对访谈资料进行了分析。研究提出,视障者外出旅游体验可分为深度、中度和低度三个层次,在不同的体验中,存在着不同程度的主观和客观障碍。针对访谈对象遇到的各种出行障碍,提出了帮助视障者实现旅游出行的四个层次的社会支持保障系统,为视障者排除障碍实现旅游出行愿望提供建议。 展开更多
关键词 视障者 旅游体验深度 无障碍旅游 社会支持保障系统
在线阅读 下载PDF
基于单目深度估计的光伏板地理定位算法
16
作者 倪源松 韩军 +1 位作者 胡广怡 王文帅 《计算机工程与应用》 北大核心 2025年第14期353-361,共9页
在光伏电站的无人机巡检中,准确定位光伏板的地理位置是关键。目前大多数定位方法依赖于地理信息数据、多视角图像或激光雷达,但这些方法难以在未知复杂环境下快速定位目标的地理位置。随着深度学习的单目深度估计(MDE)发展,MDE网络在... 在光伏电站的无人机巡检中,准确定位光伏板的地理位置是关键。目前大多数定位方法依赖于地理信息数据、多视角图像或激光雷达,但这些方法难以在未知复杂环境下快速定位目标的地理位置。随着深度学习的单目深度估计(MDE)发展,MDE网络在道路场景下已展现出较高的深度预测精度。基于此,提出了一种全新的光伏板地理定位算法,采用MDE网络估算目标距离,并根据相机成像模型将光伏板的像素坐标转换至地理坐标。为了解决经典MDE在拍摄视角多变和距离较远的无人机场景下深度预测精度不佳,设计了针对该场景优化的MDE网络(SwinDenseDepth),采用由Swin Transformer组成的编码器增强对无人机场景的深度感知能力,并结合密集连接结构与通道空间注意力融合模块,利用语义和上下文信息提高深度估计的准确性。实验结果表明相比于目前主流的MDE能更为准确地预测无人机图像中距离,并且定位算法在巡检高度30~60m的图像中定位误差在1~2m范围内,满足定位光伏板的实际需求。 展开更多
关键词 目标地理定位 单目深度估计 视觉地理定位 无人机(UAV) 光伏板组件
在线阅读 下载PDF
基于单目视觉SLAM的无人机视频实时建图框架 被引量:1
17
作者 孙一铭 张璐 +3 位作者 马腾飞 张海瑞 程傲楠 刘见礼 《测绘科学》 北大核心 2025年第5期167-176,共10页
针对在应急救灾和军事侦察等场景中,需要实时生成地图产品,传统基于运动恢复结构(SFM)的方法仅支持离线处理的问题,提出一种基于单目视觉SLAM的无人机视频实时建图框架。该框架能够实时处理无人机视频帧和GNSS/INS位姿数据,快速生成密... 针对在应急救灾和军事侦察等场景中,需要实时生成地图产品,传统基于运动恢复结构(SFM)的方法仅支持离线处理的问题,提出一种基于单目视觉SLAM的无人机视频实时建图框架。该框架能够实时处理无人机视频帧和GNSS/INS位姿数据,快速生成密集点云、数字表面模型(DSM)及数字正射影像图(DOM)。关键处理模块包括位姿解算、三维重建和地图生成。在3个不同样区的实地测试结果表明,生成的DSM的平均高程精度在2 m以内,DOM的平均平面精度在1 m以内,可以满足应急应用场景的精度需求。在效率方面,处理时间相对于飞行时间的平均延迟为4.66%,基本实现实时处理的目标。对比实验结果显示,本研究提出的框架在性能上优于先进的OpenREALM框架。 展开更多
关键词 视觉SLAM 无人机视频 位姿融合 深度图 密集点云 DSM DOM
原文传递
基于深度约束与光流跟踪的视觉SLAM方法
18
作者 尹显波 王中元 《电子测量技术》 北大核心 2025年第16期122-131,共10页
同步定位与建图(SLAM)是机器人自主导航的关键,然而传统的SLAM系统通常是针对静态环境设计的,当存在动态物体时,动态特征点会造成错误的数据关联从而导致精度和可靠性降低。并且当前的解决方案中依旧存在潜在动态对象无法检测,且动态对... 同步定位与建图(SLAM)是机器人自主导航的关键,然而传统的SLAM系统通常是针对静态环境设计的,当存在动态物体时,动态特征点会造成错误的数据关联从而导致精度和可靠性降低。并且当前的解决方案中依旧存在潜在动态对象无法检测,且动态对象占据主体时所保留的有用特征点不足等问题。为了克服这些限制,提出了一种基于ORB-SLAM2的视觉SLAM系统。首先利用yolov8目标检测提供语义信息,结合深度信息进行深度约束生成动态掩码;然后,基于动态概率进行特征点的四叉树均匀分配,剔除动态特征点的同时保留更多有用特征;最后,利用光流跟踪检测与剔除潜在动态对象上的特征点。其中动态掩码与关键帧结合实现运动分割,构建干净的密集点云地图。在TUM和Bonn数据集下的实验结果表明,相比于ORB-SLAM2,在高度动态场景中平均定位精度提高超过90%,并且在相对静止的场景中表现依旧可靠。此外,在保持实时运行的同时其性能对于当前同类别的先进方法也能有所提升。 展开更多
关键词 视觉SLAM 动态环境 目标检测 深度约束 四叉树分配 光流跟踪
原文传递
基于改进ORB特征的视觉里程计算法
19
作者 邓宇翔 陈丽 +1 位作者 吴泽州 张凯波 《计算机应用与软件》 北大核心 2025年第3期233-237,297,共6页
针对视觉里程计算法中特征点提取速度慢和存在冗余的问题,提出一种基于改进ORB特征的视觉里程计算法。设计基于2R准则的特征区域提取策略,减少特征点提取范围,加快算法速率。使用基于对角8点法的FAST算法得到更多的角点,改善FAST角点分... 针对视觉里程计算法中特征点提取速度慢和存在冗余的问题,提出一种基于改进ORB特征的视觉里程计算法。设计基于2R准则的特征区域提取策略,减少特征点提取范围,加快算法速率。使用基于对角8点法的FAST算法得到更多的角点,改善FAST角点分布,并采用基于深度的四叉树算法对特征点进行均匀化。进行特征匹配以求解相机位姿。实验结果表明,基于改进ORB特征的视觉里程计算法在相机位姿估计时有更好的精确性和实时性。 展开更多
关键词 2R准则 特征区域 深度四叉树 视觉里程计
在线阅读 下载PDF
结合深度估计网络的SLAM视觉里程计研究 被引量:2
20
作者 张功明清 《计算机与数字工程》 2025年第6期1601-1607,共7页
同时定位与建图(SLAM)是机器人、AR/VR领域的核心技术,起着联系自身位置与环境关系的重要作用。针对传统单目SLAM算法在环境尺度精确性以及系统初始化耗时长易失败等问题,提出了一种将深度估计网络与ORB-SLAM2系统灵活的结合的方案。根... 同时定位与建图(SLAM)是机器人、AR/VR领域的核心技术,起着联系自身位置与环境关系的重要作用。针对传统单目SLAM算法在环境尺度精确性以及系统初始化耗时长易失败等问题,提出了一种将深度估计网络与ORB-SLAM2系统灵活的结合的方案。根据ORB-SLAM2以关键帧为基础,展开建图与定位的工作,提出了一种有效的降低资源耗损的预处理方案。论文基于ROS架构,将SLAM视觉里程计模块与深度估计网络相结合,使单目SLAM在初始化阶段获取环境深度信息,一定程度上降低了SLAM系统初始化时间,提高了SLAM系统的精度,改善初始化时的鲁棒性易失败的情况。经过TUM数据集的测试,结果表明该方法可以有效提高单目ORB-SLAM2的精度与鲁棒性。 展开更多
关键词 同时定位与建图 ORB-SLAM2 深度估计网络 ROS 视觉里程计
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部