期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
LpDepth:基于拉普拉斯金字塔的自监督单目深度估计
1
作者 曹明伟 邢景杰 +1 位作者 程宜风 赵海锋 《计算机科学》 北大核心 2025年第3期33-40,共8页
自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影... 自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影响深度图的精度。针对上述问题,提出一种基于拉普拉斯金字塔的自监督单目深度估计方法(Self-supervised Monocular Depth Estimation Based on the Laplace Pyramid,LpDepth)。此方法的核心思想是:首先,使用拉普拉斯残差图丰富编码特征,以弥补在下采样过程中丢失的特征信息;其次,在下采样过程中使用最大池化层突显和放大特征信息,使编码器在特征提取过程中更容易地提取到训练模型所需要的特征信息;最后,使用残差模块解决过拟合问题,提高解码器对特征的利用效率。在KITTI和Make3D等数据集上对所提方法进行了测试,同时将其与现有经典方法进行了比较。实验结果证明了所提方法的有效性。 展开更多
关键词 单目深度估计 拉普拉斯金字塔 残差网络 深度图
在线阅读 下载PDF
多尺度单目深度信息辅助的铁路桥梁视觉识别方法
2
作者 杨涵 徐庆凯 +4 位作者 章金勇 蒋友 于泓川 舒江鹏 徐声亮 《东南大学学报(自然科学版)》 北大核心 2025年第5期1319-1327,共9页
为提高利用深度学习模型进行基础设施检测的计算机视觉任务的准确度和效率,提出了一种多尺度单目深度信息辅助的铁路桥梁视觉识别方法。建立了多任务神经网络,在单目深度图的辅助下,同时完成构件识别和病害分割2项任务。为充分利用深度... 为提高利用深度学习模型进行基础设施检测的计算机视觉任务的准确度和效率,提出了一种多尺度单目深度信息辅助的铁路桥梁视觉识别方法。建立了多任务神经网络,在单目深度图的辅助下,同时完成构件识别和病害分割2项任务。为充分利用深度图与2项任务在不同尺度上的相关性,在多任务神经网络结构上提出了多尺度特征交互机制。建立了多尺度多模态蒸馏模块、跨尺度特征传递模块和特征融合模块,实现了多尺度特征共享和交互,并使用大规模图片数据集对该方法进行验证。结果表明,构件识别和病害分割的平均F1分数分别为93.48%和85.93%,较无深度信息辅助的单任务网络分别提高1.87%和4.41%。与独立训练的特定于任务的网络相比,多任务网络的浮点运算数和预测时长分别降低17.89%和30.48%。由此表明,利用所提方法可以提升铁路桥梁视觉识别的准确度和效率。 展开更多
关键词 铁路桥梁 构件识别 病害分割 多任务神经网络 多尺度 单目深度图
在线阅读 下载PDF
融合单目深度和 RTK 定位的电力线弧垂测量方法 被引量:3
3
作者 郭嘉琪 景超 +3 位作者 李雪薇 王慧民 张兴忠 程永强 《电子测量技术》 北大核心 2024年第2期89-97,共9页
现有电力线路弧垂测量方法操作繁琐且智能化程度低,提出一种融合单目深度和RTK定位的电力线弧垂测量方法。首先,无人机拍摄电力线路关键点图像,将其输入构建的单目深度估计模型EleDep-Net生成对应深度图,该模型嵌入带状金字塔模块和边... 现有电力线路弧垂测量方法操作繁琐且智能化程度低,提出一种融合单目深度和RTK定位的电力线弧垂测量方法。首先,无人机拍摄电力线路关键点图像,将其输入构建的单目深度估计模型EleDep-Net生成对应深度图,该模型嵌入带状金字塔模块和边界融合注意力模块,使模型能精准地捕捉导线上下文语义信息;其次,引入深度矫正算法进一步修正深度图中的深度值,根据修正后的深度值得到关键点深度信息;最后,结合无人机RTK定位和关键点深度信息,在参考坐标系中生成关键点空间坐标进而拟合出导线抛物线公式,通过该公式计算出导线弧垂。在配网线路真实环境中进行测试,结果表明本方法在保证测量相对误差小于5%的前提下,作业效率明显提高,有较高的工程应用价值。 展开更多
关键词 单目深度估计 RTK定位 深度图 抛物线模型 弧垂测量
原文传递
三维视觉前沿进展 被引量:48
4
作者 龙霄潇 程新景 +14 位作者 朱昊 张朋举 刘浩敏 李俊 郑林涛 胡庆拥 刘浩 曹汛 杨睿刚 吴毅红 章国锋 刘烨斌 徐凯 郭裕兰 陈宝权 《中国图象图形学报》 CSCD 北大核心 2021年第6期1389-1428,共40页
在自动驾驶、机器人、数字城市以及虚拟/混合现实等应用的驱动下,三维视觉得到了广泛的关注。三维视觉研究主要围绕深度图像获取、视觉定位与制图、三维建模及三维理解等任务而展开。本文围绕上述三维视觉任务,对国内外研究进展进行了... 在自动驾驶、机器人、数字城市以及虚拟/混合现实等应用的驱动下,三维视觉得到了广泛的关注。三维视觉研究主要围绕深度图像获取、视觉定位与制图、三维建模及三维理解等任务而展开。本文围绕上述三维视觉任务,对国内外研究进展进行了综合评述和对比分析。首先,针对深度图像获取任务,从非端到端立体匹配、端到端立体匹配及无监督立体匹配3个方面对立体匹配研究进展进行了回顾,从深度回归网络和深度补全网络两个方面对单目深度估计研究进展进行了回顾。其次,针对视觉定位与制图任务,从端到端视觉定位和非端到端视觉定位两个方面对大场景下的视觉定位研究进展进行了回顾,并从视觉同步定位与地图构建和融合其他传感器的同步定位与地图构建两个方面对同步定位与地图构建的研究进展进行了回顾。再次,针对三维建模任务,从深度三维表征学习、深度三维生成模型、结构化表征学习与生成模型以及基于深度学习的三维重建等4个方面对三维几何建模研究进展进行了回顾,并从多视RGB重建、单深度相机和多深度相机方法以及单视图RGB方法等3个方面对人体动态建模研究进展进行了回顾。最后,针对三维理解任务,从点云语义分割和点云实例分割两个方面对点云语义理解研究进展进行了回顾。在此基础上,给出了三维视觉研究的未来发展趋势,旨在为相关研究者提供参考。 展开更多
关键词 立体匹配 单目深度估计 视觉定位 同步定位与地图构建(SLAM) 三维几何建模 人体动态重建 点云语义理解
原文传递
基于马尔可夫随机场的单目图像深度估计 被引量:1
5
作者 张蓓蕾 刘洪玮 《微型电脑应用》 2010年第11期49-50,59,共3页
图像深度获取是机器视觉领域活跃的研究课题。将图像深度估计问题归结为模式识别问题,以单目图像深度为待分连续模式类,在多尺度下对图像块提取绝对和相对深度特征,选择表征上下文关系的MRF(Markov Random Field)-MAP(Maximum a posteri... 图像深度获取是机器视觉领域活跃的研究课题。将图像深度估计问题归结为模式识别问题,以单目图像深度为待分连续模式类,在多尺度下对图像块提取绝对和相对深度特征,选择表征上下文关系的MRF(Markov Random Field)-MAP(Maximum a posteriori)方法,建立拉普拉斯模型,表述某图像块的深度和其邻域深度之间的关系。实验得到了某一类单目图像对应的深度图像,证明了该算法的有效性。 展开更多
关键词 单目图像 深度图像 马儿可夫随机场 最大后验概率
在线阅读 下载PDF
基于单目视觉SLAM的实时三维场景重建 被引量:2
6
作者 孙玉柱 方向忠 卢盼峰 《信息技术》 2016年第11期52-56,共5页
在室外等大规模环境下,由于存在着光照、遮挡、大量相似物和相机的旋转、抖动等问题,传统的基于特征提取的方法会在实时性、数据关联、闭环检测等方面存在限制。文中在视觉测程法的基础上使用图像直接对齐,并结合基于滤波的方法进行半... 在室外等大规模环境下,由于存在着光照、遮挡、大量相似物和相机的旋转、抖动等问题,传统的基于特征提取的方法会在实时性、数据关联、闭环检测等方面存在限制。文中在视觉测程法的基础上使用图像直接对齐,并结合基于滤波的方法进行半稠密深度图估计,进而把选取出来的关键帧图像融合到全局地图中,最后在后端采用改进的g2o[1]框架不断地对位姿图进行优化。实验结果表明,该方法取得了比较好的实时性和鲁棒性。 展开更多
关键词 单目视觉 同步定位与地图创建 图像直接对齐 半稠密深度图 图优化
在线阅读 下载PDF
视觉深度估计与点云建图研究进展 被引量:5
7
作者 陈苑锋 《液晶与显示》 CAS CSCD 北大核心 2021年第6期896-911,共16页
即时定位导航(SLAM)是无人驾驶和机器人实现自主移动的关键技术。目前广泛应用于SLAM技术中的激光雷达传感器存在成本高昂、激光点云空间分辨率低及难以获得精确的语义信息等一系列问题。视觉传感器可以有效避免上述问题,但是在深度预... 即时定位导航(SLAM)是无人驾驶和机器人实现自主移动的关键技术。目前广泛应用于SLAM技术中的激光雷达传感器存在成本高昂、激光点云空间分辨率低及难以获得精确的语义信息等一系列问题。视觉传感器可以有效避免上述问题,但是在深度预测和建图等方面需要更复杂的算法。近年来,随着处理器算力的提升、数据集的丰富和新机器视觉算法的出现,视觉深度预测和建图算法的精度和效率都有了明显提升。本文对现有视觉深度预测与视觉建图方法进行了总结,从视觉数据的采集和算法设计等方面进行分类阐述,最后针对应用场景和未来发展方向进行了分析。 展开更多
关键词 单目深度 双目深度 深度学习 点云建图
在线阅读 下载PDF
一种视觉SLAM单目半稠密建图方法的实现 被引量:4
8
作者 尚任 《智能计算机与应用》 2021年第1期89-93,共5页
SLAM即同时定位与地图构建,一直是机器人和计算机视觉的研究热点。尤其是视觉SLAM技术,21世纪以来在理论和实践上均取得了明显的突破,已逐步迈向市场应用。建图作为SLAM的两大目标之一,可以满足更多的应用需求。本文在给定相机轨迹的情... SLAM即同时定位与地图构建,一直是机器人和计算机视觉的研究热点。尤其是视觉SLAM技术,21世纪以来在理论和实践上均取得了明显的突破,已逐步迈向市场应用。建图作为SLAM的两大目标之一,可以满足更多的应用需求。本文在给定相机轨迹的情况下,提出一种视觉SLAM单目半稠密建图方法,利用极线搜索和块匹配技术,加入图像变换和逆深度高斯深度滤波器处理,以期避免单目稠密建图严重依赖纹理、计算量大的缺点,提高单目半稠密建图的准确性和鲁棒性。经测试显示,改进的单目半稠密建图方法在检测梯度变化明显像素点上更加准确,深度估计的平均误差和平方误差分别减少了9%和47%,是一种可行有效的视觉SLAM单目半稠密建图解决方案。 展开更多
关键词 视觉SLAM 建图 单目 极限搜索 块匹配 逆深度
在线阅读 下载PDF
深度网络和边缘检测融合的大规模三维单目视觉建图方法研究 被引量:2
9
作者 唐嘉宁 郭川 +1 位作者 周思达 谈海浪 《现代电子技术》 2022年第10期182-186,共5页
针对基于双目视觉的室外大规模地图构建计算时间长、实时性不足、设备要求高等问题,以及无人系统有限的搭载能力和计算力对设备轻便性、计算效率需求的不断提高,文中提出一种深度网络和边缘检测融合的大规模三维单目视觉建图方法。首先... 针对基于双目视觉的室外大规模地图构建计算时间长、实时性不足、设备要求高等问题,以及无人系统有限的搭载能力和计算力对设备轻便性、计算效率需求的不断提高,文中提出一种深度网络和边缘检测融合的大规模三维单目视觉建图方法。首先,针对单目深度值和位姿的计算问题,以SC-SfMLearner方法为基础,利用端对端的深度网络直接从单目中获取单目图像对应的深度值和位姿;其次,针对单目图像边缘检测中可能存在的边缘特征不明显等问题,通过高斯滤波平滑原始图,利用Canny算子对环境物体边缘特征进行提取,总和高斯加权二值化得到边缘特征图,实现边缘特征的优化;最后,融合特征的深度值和位姿信息,以八叉树为数据结构构建场景地图。实验结果表明,文中方法对KITTI数据集进行地图构建可得到可靠的八叉树地图,与未进行边缘检测相比,效率提高50%。该算法可行、有效,能够满足无人系统室外应用中对三维地图实时构建的要求。 展开更多
关键词 地图构建 深度网络 边缘检测 边缘特征 三维单目视觉 高斯滤波 八叉树地图
在线阅读 下载PDF
融合扩张卷积网络与SLAM的无监督单目深度估计 被引量:9
10
作者 戴仁月 方志军 高永彬 《激光与光电子学进展》 CSCD 北大核心 2020年第6期106-114,共9页
针对由一般卷积神经网络预测的粗糙特征生成的深度图质量低、监督学习处理任务限制数据量等问题,提出一种新颖的融合扩张卷积神经网络和同时定位与建图(SLAM)的无监督单目深度估计方法。该方法采用视图重构的思想估计深度,利用光学一致... 针对由一般卷积神经网络预测的粗糙特征生成的深度图质量低、监督学习处理任务限制数据量等问题,提出一种新颖的融合扩张卷积神经网络和同时定位与建图(SLAM)的无监督单目深度估计方法。该方法采用视图重构的思想估计深度,利用光学一致性误差约束网络训练,扩大感受野,考虑图片细节特征。同时采用SLAM算法优化相机姿态,并将其嵌入视图重构框架中,实现单目图片与其深度图的直接映射。利用该方法在公开的KITTI数据集上进行实验,结果表明,与经典的sfmlearner方法相比,误差度量指标绝对差、平方差、均方差和对数均方差分别降低了0.032、0.634、1.095和0.026;准确率度量指标δ1、δ2和δ3分别提升了3.8%、2.6%和0.9%。该模型的可用性与稳健性得到验证。 展开更多
关键词 图像处理 扩张卷积神经网络 同时定位与建图 无监督学习 单目视觉 深度估计
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部