期刊文献+
共找到613篇文章
< 1 2 31 >
每页显示 20 50 100
A Fast Depth-Map Generation Algorithm based on Motion Search from 2D Video Contents 被引量:1
1
作者 Weiwei Wang Yuesheng Zhu 《Journal of Software Engineering and Applications》 2012年第12期144-148,共5页
Generation of a depth-map from 2D video is the kernel of DIBR (Depth Image Based Rendering) in 2D-3D video conversion systems. However it occupies over most of the system resource where the motion search module takes ... Generation of a depth-map from 2D video is the kernel of DIBR (Depth Image Based Rendering) in 2D-3D video conversion systems. However it occupies over most of the system resource where the motion search module takes up 90% time-consuming in typical motion estimation-based depth-map generation algorithms. In order to reduce the computational complexity, in this paper a new fast depth-map generation algorithm based on motion search is developed, in which a fast diamond search algorithm is adopted to decide whether a 16x16 or 4x4 block size is used based on Sobel operator in the motion search module to obtain a sub-depth-map. Then the sub-depth-map will be fused with the sub-depth-maps gotten from depth from color component Cr and depth from linear perspective modules to compensate and refine detail of the depth-map, finally obtain a better depth-map. The simulation results demonstrate that the new approach can greatly reduce over 50% computational complexity compared to other existing methods. 展开更多
关键词 BLOCK-MATCHING depth-map MOTION SEARCH DIBR
暂未订购
基于depth-map和分布式视频编码的多视点视频传输方法 被引量:1
2
作者 吴琳 金志刚 +1 位作者 赵安安 周圆 《计算机应用》 CSCD 北大核心 2012年第9期2441-2444,共4页
针对多视点视频传输系统数据量庞大的问题,提出一种基于深度图(depth-map)和分布式视频编码(DVC)的不等错误保护(UEP)传输方法。该方法首先基于多个视点提取深度图;然后,在传输过程中传输一个视点及其深度图;最后,经过网络传输,在解码... 针对多视点视频传输系统数据量庞大的问题,提出一种基于深度图(depth-map)和分布式视频编码(DVC)的不等错误保护(UEP)传输方法。该方法首先基于多个视点提取深度图;然后,在传输过程中传输一个视点及其深度图;最后,经过网络传输,在解码端由一个视点图及其深度图生成其他视点。由于视点图和深度图在解码端的重要程度不同,对需要传输的视点图和深度图采用不同的分布式视频编码方法,进行不平等的错误保护。仿真实验结果表明,所提传输方法比传统的分布式多视点视频编码传输系统具有更好的抗误码性能,提高了传输可靠性,图像的峰值信噪比(PSNR)约提高1.5 dB。 展开更多
关键词 分布式视频编码 WYNER-ZIV编码 深度图 不等错误保护
在线阅读 下载PDF
面向自动驾驶的稀疏深度图补全方法SFN-D
3
作者 吴彬 赵海燕 +1 位作者 曹健 陈庆奎 《计算机应用研究》 北大核心 2025年第11期3476-3481,共6页
在自动驾驶领域,稀疏深度图的密集化是重要研究课题,对3D重建和3D目标检测等任务具有突出意义。提出一种新颖的深度补全框架SFN-D,该框架基于多模态数据融合和语义分割设计,利用多模态数据各自的优势来补充稀疏深度图中的缺失深度,从而... 在自动驾驶领域,稀疏深度图的密集化是重要研究课题,对3D重建和3D目标检测等任务具有突出意义。提出一种新颖的深度补全框架SFN-D,该框架基于多模态数据融合和语义分割设计,利用多模态数据各自的优势来补充稀疏深度图中的缺失深度,从而有效补充稀疏深度图。为了实现这一目标,采取一种借助传感器标定进行数据转换,从而实现多模态数据融合和深度图修正的方案。该框架融合了来自图像和激光雷达的特征图,可与现有任何优秀的点云语义分割网络和图片分割网络相适配,无需任何专家知识且能够开放性地实现稀疏深度图的深度补全。使用自动驾驶领域中广泛使用的KITTI depth compeletion数据集与相似深度补全方法评估了SFN-D,实验结果表明与其他深度补全方法相比,SFN-D有效且有更高的精度。 展开更多
关键词 深度补全 多模态融合 自动驾驶 稀疏深度图
在线阅读 下载PDF
深度感知的息肉分割算法
4
作者 秦婧 张俊 +2 位作者 李嫣 任文琦 张金刚 《工程科学与技术》 北大核心 2025年第2期74-83,共10页
息肉分割在结直肠癌预防和肠道疾病诊断中起着关键作用。然而,现有的息肉分割算法普遍忽视了息肉的3维凸起特性,限制了其分割性能的提升。深度图能够提供关于息肉凸起和形状的额外信息,从而更准确地捕捉息肉的空间结构。因此,本文提出... 息肉分割在结直肠癌预防和肠道疾病诊断中起着关键作用。然而,现有的息肉分割算法普遍忽视了息肉的3维凸起特性,限制了其分割性能的提升。深度图能够提供关于息肉凸起和形状的额外信息,从而更准确地捕捉息肉的空间结构。因此,本文提出了一种深度感知的息肉分割网络(depth aware network for polyp segmentation,DANet),通过结合深度信息,改善分割模型对于息肉边界和形状的识别能力。该网络包括一个空域分支、一个深度分支及一个特征融合模块。空域分支采用基于Transformer的编码器,获得多尺度的特征表示。深度分支用于提取息肉的深度级别特征,并通过注意力机制关注息肉的3维结构。特征融合模块将息肉和周围组织的深度差异引入多尺度特征中,增强各尺度特征对息肉位置和形态的识别能力。在5个息肉数据集和6个评价指标上将本文算法DANet与多个先进息肉分割算法进行了对比实验,实验结果显示,DANet在Kvasir-SEG数据集上的Dice系数和交并比分别达到了0.911和0.855,而在CVC-ClinicDB数据集上则分别达到了0.934和0.884,显著优于现有方法。 展开更多
关键词 深度感知 息肉分割 深度学习 深度图
在线阅读 下载PDF
基于多视角边缘检测融合的放射性物品运输容器特征提取
5
作者 张沛东 肖连博 +4 位作者 张煜航 焦力敏 孙洪超 庄大杰 李国强 《包装工程》 北大核心 2025年第11期294-302,共9页
目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包... 目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包围立方体,并设计六自由度多视角正交投影系统,将三维点云降维映射至二维深度图,实现容器全表面覆盖;其次,基于拟合边缘模型及局部灰度面积效应,检测亚像素边缘点;进一步结合投影参数化映射与动态曲率插值算法,引入法向量连续性约束及加权融合策略,重构高保真三维特征点;最后,搭建实验系统,获取容器三维点云数据,基于简化率、配准误差及计算时间指标,并与现有点云特征提取方法进行对比。结果采用所提方法获取特征点云,其配准最大平均误差为1.33 mm,最大均方根误差为1.39 mm,简化率为1.6%。与其他文献的结果相比,所提方法的简化率更小,计算时间更短,且误差更小。结论所提方法有效解决了大规模点云处理与几何特征保真之间的矛盾,显著提升了放射性容器三维特征提取的精度和效率,为核能工程安全评估提供了可靠的几何形变量化分析技术支撑。 展开更多
关键词 放射性物品运输容器 三维形变测量 多视角深度图融合 亚像素边缘检测
在线阅读 下载PDF
融合自适应采样与全局感知的图像深度估计算法
6
作者 王国相 李昌隆 +2 位作者 宋俊锋 叶振 金恒 《计算机工程与应用》 北大核心 2025年第5期261-268,共8页
深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全... 深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全局感知的图像深度估计算法,由粗粒度到细粒度逐步预测深度图。通过引入预训练的深度补全网络预测粗粒度的稠密深度图,获取丰富的场景结构信息和语义信息。设计自适应深度采样方法,引导算法模型对远处的区域施加更多关注,缓解深度数据的长尾分布问题。同时通过新设计的全局感知模块,捕获并融合多尺度特征,从而获取更多的场景上下文信息。在NYU-Depth-v2数据集上的实验结果表明,算法在整体性能上超越了其他方法;消融实验的结果验证了提出的各个模块的有效性;Zero-shot实验的结果表明算法有较好的泛化性能,其中在ScanNet数据集上的阈值精度指标δ<1.25相比P3D方法提升了42个百分点,相比S2D方法则提升了3.8个百分点。 展开更多
关键词 深度估计 深度补全 稠密深度图 多尺度特征融合 自适应采样
在线阅读 下载PDF
基于BSA-seq技术的块茎芽眼深度QTL定位分析
7
作者 邵顺伟 陈卓 +9 位作者 兰振东 蔡兴奎 邹华芬 李晨曦 唐景华 朱熙 张彧 董建科 金辉 宋波涛 《作物学报》 北大核心 2025年第7期1725-1735,共11页
芽眼深度是马铃薯块茎的重要性状之一,对马铃薯的外观品质及加工适宜性具有重要影响。为挖掘控制马铃薯芽眼深度的数量性状位点,本研究以四倍体深芽眼品种“华薯12”为母本、浅芽眼高代品系“天2002-4-5”为父本,杂交获得F_(1)代分离群... 芽眼深度是马铃薯块茎的重要性状之一,对马铃薯的外观品质及加工适宜性具有重要影响。为挖掘控制马铃薯芽眼深度的数量性状位点,本研究以四倍体深芽眼品种“华薯12”为母本、浅芽眼高代品系“天2002-4-5”为父本,杂交获得F_(1)代分离群体,共255份无性系。基于连续2年田间表型观测数据,分别选取20个深芽眼和20个浅芽眼个体构建混合池,利用BSA-seq技术进行芽眼深度相关性状的QTL定位,并结合传统QTL定位方法,采用完备区间作图法构建遗传连锁图谱,成功定位到2个与芽眼深度相关的QTL位点。2年表型相关性分析结果表明,马铃薯块茎芽眼深度主要受遗传因素的控制。10号染色体上qEyd10.1位点的LOD值为4.96,表型贡献率为14.49%;3号染色体上qEyd3.1位点的LOD值为3.29,表型贡献率为10.18%。其中, qEyd3.1与此前报道的芽眼深度调控位点一致,而qEyd10.1为新发现的QTL。2个位点的加性效应均为负值,表明降低芽眼深度的等位基因来源于浅芽眼亲本“天2002-4-5”。通过对定位区间内候选基因注释结合芽眼深浅材料基因结构变异分析,推测Soltu.DM.10G029390.1、Soltu.DM.03G036540.1、Soltu.DM.03G036140.1和Soltu.DM.03G036580.1可能为与芽眼深度相关的候选基因。本研究通过BSA-seq与传统QTL定位相结合的方式,快速完成了同源四倍体马铃薯中芽眼深度这一数量性状的调控位点定位工作,并初步确定了4个候选基因,为进一步完成芽眼深度调控基因的克隆及其遗传机制解析奠定了重要基础,也为培育具有浅芽眼块茎的四倍体马铃薯新品种提供了参考。 展开更多
关键词 马铃薯 芽眼深度 QTL定位 BSA-seq 遗传连锁图谱
在线阅读 下载PDF
动态环境下基于深度图的无人车激光SLAM算法 被引量:1
8
作者 孙明晓 王鑫源 +2 位作者 栾添添 王潇 刘鹏飞 《仪器仪表学报》 北大核心 2025年第3期101-109,共9页
针对激光SLAM在动态环境下出现精度下降与系统鲁棒性差的问题,故提出一种动态环境下基于深度图的无人车激光SLAM算法。首先,针对激光入射光线贴近地面时,部分地面点云会被误判为动态障碍物的问题,通过角度阈值将激光点云分割为地面点云... 针对激光SLAM在动态环境下出现精度下降与系统鲁棒性差的问题,故提出一种动态环境下基于深度图的无人车激光SLAM算法。首先,针对激光入射光线贴近地面时,部分地面点云会被误判为动态障碍物的问题,通过角度阈值将激光点云分割为地面点云与非地面点云,排除地面点云的影响。其次,将非地面点云投影为深度图,把三维空间中的点云投影到二维图像上,采用图像领域的方法减少点云数据处理的复杂度。然后,针对稀疏的激光点云不能准确反映真实环境的问题,利用激光雷达的距离信息作为自适应调节深度图的权重设置深度图的分辨率,使得在不同距离区间的深度图具有不同的分辨率,在不同的距离区间都能够准确识别出动态障碍物,提高系统识别动态障碍物的效率。最后,将局部地图与激光雷达查询帧所形成的深度图进行像素相减,通过得到的视差图去除动态障碍物,并通过降低深度图的分辨率恢复被误删的静态点,得到高精度静态地图。通过实验验证,在仿真环境中,本算法的动态障碍物移除分数为94.13%。在KITTI数据集中,本算法的动态障碍物移除分数为95.22%。在小场景环境和大场景环境中,本算法的动态障碍物移除分数分别为96.43%和93.30%。算法能高效去除动态障碍物,提高地图精度与系统鲁棒性。 展开更多
关键词 SLAM 动态环境 点云分割 深度图 无人车
原文传递
基于雾天模拟图像的能见度估计方法研究
9
作者 邱实卓 叶青 +1 位作者 黄佳恒 刘建平 《电光与控制》 北大核心 2025年第3期94-100,共7页
针对带有能见度标签的雾天图像数据集匮乏的问题,提出一种基于雾天模拟图像的能见度检测方法。通过无监督深度估计模型构建户外清晰图像的深度图,并且利用特征融合来细化深度图细节,采用暗通道法筛选天空区域估计大气光值,获得设定能见... 针对带有能见度标签的雾天图像数据集匮乏的问题,提出一种基于雾天模拟图像的能见度检测方法。通过无监督深度估计模型构建户外清晰图像的深度图,并且利用特征融合来细化深度图细节,采用暗通道法筛选天空区域估计大气光值,获得设定能见度下户外图像的透射率图,进一步获得带有不同能见度标签的雾天模拟图像数据集,基于此利用改进后的ShuffleNet V2网络训练能见度估计模型。对数据集和真实雾天图像进行了能见度等级估计的验证实验,实验结果表明,对能见度小于500 m的雾天图像具有良好的能见度估测结果,对小于200 m的检测准确率高于90%,总体准确率为87.8%,表明该方法具有可行性,可用于大雾条件下的道路能见度等级估测。 展开更多
关键词 雾天模拟 深度图 特征融合 ShuffleNet V2 能见度估计
在线阅读 下载PDF
基于结构纹理分解的深度图超分辨率重建
10
作者 唐思远 孙涛 +2 位作者 付柏 殷杰 张国荣 《武汉大学学报(工学版)》 北大核心 2025年第4期665-676,共12页
彩色图像引导的深度图超分辨率重建能有效解决深度相机采集深度图时分辨率低和无效空洞的问题。然而,由于彩色图和深度图的结构不一致性,此类方法容易产生纹理转移伪影。针对此问题,提出了基于结构纹理分解的加权最小二乘(structure tex... 彩色图像引导的深度图超分辨率重建能有效解决深度相机采集深度图时分辨率低和无效空洞的问题。然而,由于彩色图和深度图的结构不一致性,此类方法容易产生纹理转移伪影。针对此问题,提出了基于结构纹理分解的加权最小二乘(structure texture decomposition based weighted least square,STDWLS)深度超分辨率重建算法。该方法首先使用原深度图引导彩色图片结构纹理分解得到结构图,随后使用加权最小二乘优化框架来同时建模深度图上采样和空洞填充问题,并对有效深度值和空洞区域分别构建相应的惩罚函数。具体而言,对于有效深度值,该方法结合静态的结构图和动态更新的深度值计算引导权重;对于空洞,该方法仅使用结构图计算引导权重,并加入边缘自适应窗口来防止深度图边缘模糊。实验结果表明,STDWLS算法能够同时完成深度图上采样和空洞填充任务,有效抑制了纹理转移伪影,提高了深度图重建的精确度与表面结构相似度。 展开更多
关键词 深度图超分辨率重建 空洞填充 纹理结构分解 加权最小二乘
原文传递
互补跨模态交互的RGB-D显著目标检测网络
11
作者 王双凤 吴观茂 +1 位作者 周华平 孙克雷 《阜阳师范大学学报(自然科学版)》 2025年第1期23-29,共7页
由于RGB和深度模态包含不同的特征,因此如何有效融合多模态信息和跨阶段特征的交互是RGB-D显著目标检测的关键问题。为此,本文提出一种互补跨模态交互的RGB-D显著目标检测网络,该模型由多模态交互注意力编码器和渐进金字塔解码器两部分... 由于RGB和深度模态包含不同的特征,因此如何有效融合多模态信息和跨阶段特征的交互是RGB-D显著目标检测的关键问题。为此,本文提出一种互补跨模态交互的RGB-D显著目标检测网络,该模型由多模态交互注意力编码器和渐进金字塔解码器两部分组成,编码器部分引入RGB诱导细节增强模块和深度诱导语义增强模块,模拟了不同卷积层中RGB和深度模态的互补性来实现跨模态信息交互。此外,引入渐进金字塔解码器能够进一步提取更多有用的特征来增强模型预测,保证特征兼容性。实验结果表明,与其他方法对比,本文方法具有较好效果。 展开更多
关键词 深度图 跨模态 渐进金字塔 信息交互
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
12
作者 贾克斌 吴岳珩 《北京工业大学学报》 北大核心 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
多传感器融合的无人车SLAM系统研究
13
作者 吴文昊 谷玉海 《重庆理工大学学报(自然科学)》 北大核心 2025年第1期229-235,共7页
为提高无人车的避障能力,使其能够在构建的地图环境中高效地进行自动定位和路径规划,提出一种多传感器融合的无人车SLAM系统。对于障碍物监测,采用激光雷达与深度相机信息融合的方法构建地图,以融合得到更精准的栅格图。搭建了履带式差... 为提高无人车的避障能力,使其能够在构建的地图环境中高效地进行自动定位和路径规划,提出一种多传感器融合的无人车SLAM系统。对于障碍物监测,采用激光雷达与深度相机信息融合的方法构建地图,以融合得到更精准的栅格图。搭建了履带式差速底盘运动学模型,通过融合IMU数据提高位姿估计精度;分析了贝叶斯推理方法,在决策层以该方法有效融合激光雷达与深度相机的数据;提出基于卡尔曼滤波算法动态调整权重将雷达与相机的后验概率融合,得到最终的地图栅格信息。最后,根据融合后的数据构建地图并实现自主导航的功能。通过对比实验发现,改进的多传感器融合建图算法定位精度综合提高了91.67%,实时的整体性能提升了54.46%,栅格建图完整性提升了6.59%。 展开更多
关键词 贝叶斯算法 融合建图 激光雷达 深度相机 ROS2
在线阅读 下载PDF
激光雷达点云球面投影与相机融合的环境语义分割算法
14
作者 杨涵 高骏 +6 位作者 刘勇 贺秀伟 檀利 殷艳坤 申晓雷 杨菲菲 彭成磊 《装备环境工程》 2025年第7期9-15,共7页
目的 融合激光雷达与相机的多模态信息,完成语义分割任务。方法 通过球面投影,将激光雷达三维点云转化为二维稀疏深度图,与相机图像实现像素级对齐。在神经网络模型中,设计非对称双分支编码器,使用稀疏卷积提取深度图特征,使用残差结构... 目的 融合激光雷达与相机的多模态信息,完成语义分割任务。方法 通过球面投影,将激光雷达三维点云转化为二维稀疏深度图,与相机图像实现像素级对齐。在神经网络模型中,设计非对称双分支编码器,使用稀疏卷积提取深度图特征,使用残差结构提取相机图像特征,2种模态的特征通过融合网络实现特征混合,得到融合图像。对融合图像使用基于跳跃连接的解码器解析特征,恢复分辨率并生成语义分割结果。结果 设计的算法有效提取和融合了2种模态的特征,降低了环境因素对单传感器的干扰,提高了语义分割的精确度和稳健性。算法在KITTI数据集上的mIoU指标达到了64.4%,较传统单模态环境语义分割算法提升了8.6%,且受光照影响更小。结论 相机的色彩纹理信息与激光雷达的精确深度信息具备信息维度互补能力,本文设计的多模态融合环境语义分割算法有效完成了环境语义分割任务,具备较高的精确度与稳健性。 展开更多
关键词 语义分割 环境感知 多模态感知 深度学习 特征融合 激光雷达 深度图
在线阅读 下载PDF
基于特征点云配准的SLAM重建深度优化方法
15
作者 曹学伟 袁杰 梁荣光 《计算机工程与设计》 北大核心 2025年第3期657-664,共8页
针对视觉SLAM特征法中深度估计准确性和可靠性偏低的问题,提出一种基于特征点云配准的SLAM重建深度优化方法。利用SHOT特征描述子对三维点云提取特征,使用特征点云配准替代传统视觉特征法进行相机位姿估计。通过设定节点误差函数,优化... 针对视觉SLAM特征法中深度估计准确性和可靠性偏低的问题,提出一种基于特征点云配准的SLAM重建深度优化方法。利用SHOT特征描述子对三维点云提取特征,使用特征点云配准替代传统视觉特征法进行相机位姿估计。通过设定节点误差函数,优化视觉特征法建立的点云及其二义性点,建立带有纹理效果的稠密点云模型。在TUM和ICL-NUIM数据集上进行仿真实验,其结果表明,该方法相对于传统SLAM方法的相机位姿轨迹精度提升了10%。采用Kinect v2型RGB-D相机验证了该方法的有效性,实现了室内场景具有一定纹理效果的模型建立。 展开更多
关键词 点云配准 相机位姿估计 深度优化 稠密建图 同时定位与地图构建 点云地图 点云特征
在线阅读 下载PDF
LpDepth:基于拉普拉斯金字塔的自监督单目深度估计
16
作者 曹明伟 邢景杰 +1 位作者 程宜风 赵海锋 《计算机科学》 北大核心 2025年第3期33-40,共8页
自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影... 自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影响深度图的精度。针对上述问题,提出一种基于拉普拉斯金字塔的自监督单目深度估计方法(Self-supervised Monocular Depth Estimation Based on the Laplace Pyramid,LpDepth)。此方法的核心思想是:首先,使用拉普拉斯残差图丰富编码特征,以弥补在下采样过程中丢失的特征信息;其次,在下采样过程中使用最大池化层突显和放大特征信息,使编码器在特征提取过程中更容易地提取到训练模型所需要的特征信息;最后,使用残差模块解决过拟合问题,提高解码器对特征的利用效率。在KITTI和Make3D等数据集上对所提方法进行了测试,同时将其与现有经典方法进行了比较。实验结果证明了所提方法的有效性。 展开更多
关键词 单目深度估计 拉普拉斯金字塔 残差网络 深度图
在线阅读 下载PDF
基于单目视觉SLAM的无人机视频实时建图框架
17
作者 孙一铭 张璐 +3 位作者 马腾飞 张海瑞 程傲楠 刘见礼 《测绘科学》 北大核心 2025年第5期167-176,共10页
针对在应急救灾和军事侦察等场景中,需要实时生成地图产品,传统基于运动恢复结构(SFM)的方法仅支持离线处理的问题,提出一种基于单目视觉SLAM的无人机视频实时建图框架。该框架能够实时处理无人机视频帧和GNSS/INS位姿数据,快速生成密... 针对在应急救灾和军事侦察等场景中,需要实时生成地图产品,传统基于运动恢复结构(SFM)的方法仅支持离线处理的问题,提出一种基于单目视觉SLAM的无人机视频实时建图框架。该框架能够实时处理无人机视频帧和GNSS/INS位姿数据,快速生成密集点云、数字表面模型(DSM)及数字正射影像图(DOM)。关键处理模块包括位姿解算、三维重建和地图生成。在3个不同样区的实地测试结果表明,生成的DSM的平均高程精度在2 m以内,DOM的平均平面精度在1 m以内,可以满足应急应用场景的精度需求。在效率方面,处理时间相对于飞行时间的平均延迟为4.66%,基本实现实时处理的目标。对比实验结果显示,本研究提出的框架在性能上优于先进的OpenREALM框架。 展开更多
关键词 视觉SLAM 无人机视频 位姿融合 深度图 密集点云 DSM DOM
原文传递
多尺度单目深度信息辅助的铁路桥梁视觉识别方法
18
作者 杨涵 徐庆凯 +4 位作者 章金勇 蒋友 于泓川 舒江鹏 徐声亮 《东南大学学报(自然科学版)》 北大核心 2025年第5期1319-1327,共9页
为提高利用深度学习模型进行基础设施检测的计算机视觉任务的准确度和效率,提出了一种多尺度单目深度信息辅助的铁路桥梁视觉识别方法。建立了多任务神经网络,在单目深度图的辅助下,同时完成构件识别和病害分割2项任务。为充分利用深度... 为提高利用深度学习模型进行基础设施检测的计算机视觉任务的准确度和效率,提出了一种多尺度单目深度信息辅助的铁路桥梁视觉识别方法。建立了多任务神经网络,在单目深度图的辅助下,同时完成构件识别和病害分割2项任务。为充分利用深度图与2项任务在不同尺度上的相关性,在多任务神经网络结构上提出了多尺度特征交互机制。建立了多尺度多模态蒸馏模块、跨尺度特征传递模块和特征融合模块,实现了多尺度特征共享和交互,并使用大规模图片数据集对该方法进行验证。结果表明,构件识别和病害分割的平均F1分数分别为93.48%和85.93%,较无深度信息辅助的单任务网络分别提高1.87%和4.41%。与独立训练的特定于任务的网络相比,多任务网络的浮点运算数和预测时长分别降低17.89%和30.48%。由此表明,利用所提方法可以提升铁路桥梁视觉识别的准确度和效率。 展开更多
关键词 铁路桥梁 构件识别 病害分割 多任务神经网络 多尺度 单目深度图
在线阅读 下载PDF
基于双向时空特征学习的人体深度图像估计
19
作者 朱子斌 李千林 +1 位作者 张小燕 韩双双 《计算机工程》 北大核心 2025年第10期258-269,共12页
为了更准确地预测人体的深度图像,提出一种基于视频的人体深度图像估计方法BiSTNet。为了从视频中充分挖掘三维(3D)信息,提出双向时空特征学习模型,分别从过去帧和未来帧2个序列方向学习双向时空特征,并利用双向时空特征注意力模型来强... 为了更准确地预测人体的深度图像,提出一种基于视频的人体深度图像估计方法BiSTNet。为了从视频中充分挖掘三维(3D)信息,提出双向时空特征学习模型,分别从过去帧和未来帧2个序列方向学习双向时空特征,并利用双向时空特征注意力模型来强化有效帧的影响。同时,引入多尺度特征融合预测模块,在有效融合双向时空特征和空间特征的基础上,预测精确的、具有丰富局部几何细节的深度图像,使得由预测深度图像重建的3D模型更加逼真。在模型训练过程中,使用人体关节相对顺序关系约束和双向序列自监督学习策略,在提高预测精度的同时降低对有监督数据的依赖性。实验结果表明,BiSTNet方法不仅能有效降低预测深度图像的误差,而且所预测的深度图像细节丰富。 展开更多
关键词 双向时空特征 多尺度特征融合 双向自监督 深度图像估计 人体关节相对顺序关系约束
在线阅读 下载PDF
利用图像边缘的场景三维模型快速变化检测
20
作者 冯智超 晋诗瑶 尹增山 《测绘地理信息》 2025年第3期91-97,共7页
为解决现有利用图像检测三维模型变化的重投影方法因多角度照片导致的累积误差大、耗时长、对变化物所遮挡背景的颜色有条件限制等问题,本文利用深度图内边缘信息能够反映场景中物体轮廓信息的特点,提出了一种基于三维模型深度图边缘的... 为解决现有利用图像检测三维模型变化的重投影方法因多角度照片导致的累积误差大、耗时长、对变化物所遮挡背景的颜色有条件限制等问题,本文利用深度图内边缘信息能够反映场景中物体轮廓信息的特点,提出了一种基于三维模型深度图边缘的移除物检测方法。该方法推导出了深度图非边缘像素的倒数呈线性分布的规律,然后采用提出的算法对深度图和实景照片进行边缘差异检测和聚类,实现了利用单张实景照片对场景移除物的高效检测。结果显示,在移除物检测上,此方法只需利用1张图像,精确度和计算成本优于原重投影方法利用5张的效果。 展开更多
关键词 变化检测 三维模型 深度图 边缘点
原文传递
上一页 1 2 31 下一页 到第
使用帮助 返回顶部