期刊文献+
共找到619篇文章
< 1 2 31 >
每页显示 20 50 100
A Fast Depth-Map Generation Algorithm based on Motion Search from 2D Video Contents 被引量:1
1
作者 Weiwei Wang Yuesheng Zhu 《Journal of Software Engineering and Applications》 2012年第12期144-148,共5页
Generation of a depth-map from 2D video is the kernel of DIBR (Depth Image Based Rendering) in 2D-3D video conversion systems. However it occupies over most of the system resource where the motion search module takes ... Generation of a depth-map from 2D video is the kernel of DIBR (Depth Image Based Rendering) in 2D-3D video conversion systems. However it occupies over most of the system resource where the motion search module takes up 90% time-consuming in typical motion estimation-based depth-map generation algorithms. In order to reduce the computational complexity, in this paper a new fast depth-map generation algorithm based on motion search is developed, in which a fast diamond search algorithm is adopted to decide whether a 16x16 or 4x4 block size is used based on Sobel operator in the motion search module to obtain a sub-depth-map. Then the sub-depth-map will be fused with the sub-depth-maps gotten from depth from color component Cr and depth from linear perspective modules to compensate and refine detail of the depth-map, finally obtain a better depth-map. The simulation results demonstrate that the new approach can greatly reduce over 50% computational complexity compared to other existing methods. 展开更多
关键词 BLOCK-MATCHING depth-map MOTION SEARCH DIBR
暂未订购
基于depth-map和分布式视频编码的多视点视频传输方法 被引量:1
2
作者 吴琳 金志刚 +1 位作者 赵安安 周圆 《计算机应用》 CSCD 北大核心 2012年第9期2441-2444,共4页
针对多视点视频传输系统数据量庞大的问题,提出一种基于深度图(depth-map)和分布式视频编码(DVC)的不等错误保护(UEP)传输方法。该方法首先基于多个视点提取深度图;然后,在传输过程中传输一个视点及其深度图;最后,经过网络传输,在解码... 针对多视点视频传输系统数据量庞大的问题,提出一种基于深度图(depth-map)和分布式视频编码(DVC)的不等错误保护(UEP)传输方法。该方法首先基于多个视点提取深度图;然后,在传输过程中传输一个视点及其深度图;最后,经过网络传输,在解码端由一个视点图及其深度图生成其他视点。由于视点图和深度图在解码端的重要程度不同,对需要传输的视点图和深度图采用不同的分布式视频编码方法,进行不平等的错误保护。仿真实验结果表明,所提传输方法比传统的分布式多视点视频编码传输系统具有更好的抗误码性能,提高了传输可靠性,图像的峰值信噪比(PSNR)约提高1.5 dB。 展开更多
关键词 分布式视频编码 WYNER-ZIV编码 深度图 不等错误保护
在线阅读 下载PDF
基于PatchmatchNet的钢轨表面三维重构
3
作者 胡鹏宇 钟倩文 郑树彬 《电子科技》 2026年第2期87-95,共9页
钢轨表面故障多发且类型复杂,传统基于一维信号或二维图像方法虽然能够有效判定缺陷的存在,但难以体现其结构特征,因此无法精确评估损伤程度。针对该问题,文中提出了一种基于PatchmatchNet模型的钢轨表面三维重构方法。通过采样实验得... 钢轨表面故障多发且类型复杂,传统基于一维信号或二维图像方法虽然能够有效判定缺陷的存在,但难以体现其结构特征,因此无法精确评估损伤程度。针对该问题,文中提出了一种基于PatchmatchNet模型的钢轨表面三维重构方法。通过采样实验得到多视角钢轨表面图像,预处理后形成可用于重构的三维数据集。在此基础上通过FPN(Feature Pyramid Network)网络提取多尺度特征,并进行深度初始化、匹配代价计算、匹配代价自适应传播和聚合,构建以从粗到细方式预测钢轨表面的深度图,并经深度图融合和点云过滤得到优化后的钢轨表面点云。结果表明,钢轨表面点云具有良好的完整性和准确性,且缺陷在点云中也表现出不同深度差,通过分析局部结构可以初步判断缺陷类型及损伤程度。 展开更多
关键词 钢轨表面异常 缺陷检测 三维重构 PatchmatchNet FPN 深度图 钢轨表面点云 深度估计
在线阅读 下载PDF
面向自动驾驶的稀疏深度图补全方法SFN-D
4
作者 吴彬 赵海燕 +1 位作者 曹健 陈庆奎 《计算机应用研究》 北大核心 2025年第11期3476-3481,共6页
在自动驾驶领域,稀疏深度图的密集化是重要研究课题,对3D重建和3D目标检测等任务具有突出意义。提出一种新颖的深度补全框架SFN-D,该框架基于多模态数据融合和语义分割设计,利用多模态数据各自的优势来补充稀疏深度图中的缺失深度,从而... 在自动驾驶领域,稀疏深度图的密集化是重要研究课题,对3D重建和3D目标检测等任务具有突出意义。提出一种新颖的深度补全框架SFN-D,该框架基于多模态数据融合和语义分割设计,利用多模态数据各自的优势来补充稀疏深度图中的缺失深度,从而有效补充稀疏深度图。为了实现这一目标,采取一种借助传感器标定进行数据转换,从而实现多模态数据融合和深度图修正的方案。该框架融合了来自图像和激光雷达的特征图,可与现有任何优秀的点云语义分割网络和图片分割网络相适配,无需任何专家知识且能够开放性地实现稀疏深度图的深度补全。使用自动驾驶领域中广泛使用的KITTI depth compeletion数据集与相似深度补全方法评估了SFN-D,实验结果表明与其他深度补全方法相比,SFN-D有效且有更高的精度。 展开更多
关键词 深度补全 多模态融合 自动驾驶 稀疏深度图
在线阅读 下载PDF
深度感知的息肉分割算法
5
作者 秦婧 张俊 +2 位作者 李嫣 任文琦 张金刚 《工程科学与技术》 北大核心 2025年第2期74-83,共10页
息肉分割在结直肠癌预防和肠道疾病诊断中起着关键作用。然而,现有的息肉分割算法普遍忽视了息肉的3维凸起特性,限制了其分割性能的提升。深度图能够提供关于息肉凸起和形状的额外信息,从而更准确地捕捉息肉的空间结构。因此,本文提出... 息肉分割在结直肠癌预防和肠道疾病诊断中起着关键作用。然而,现有的息肉分割算法普遍忽视了息肉的3维凸起特性,限制了其分割性能的提升。深度图能够提供关于息肉凸起和形状的额外信息,从而更准确地捕捉息肉的空间结构。因此,本文提出了一种深度感知的息肉分割网络(depth aware network for polyp segmentation,DANet),通过结合深度信息,改善分割模型对于息肉边界和形状的识别能力。该网络包括一个空域分支、一个深度分支及一个特征融合模块。空域分支采用基于Transformer的编码器,获得多尺度的特征表示。深度分支用于提取息肉的深度级别特征,并通过注意力机制关注息肉的3维结构。特征融合模块将息肉和周围组织的深度差异引入多尺度特征中,增强各尺度特征对息肉位置和形态的识别能力。在5个息肉数据集和6个评价指标上将本文算法DANet与多个先进息肉分割算法进行了对比实验,实验结果显示,DANet在Kvasir-SEG数据集上的Dice系数和交并比分别达到了0.911和0.855,而在CVC-ClinicDB数据集上则分别达到了0.934和0.884,显著优于现有方法。 展开更多
关键词 深度感知 息肉分割 深度学习 深度图
在线阅读 下载PDF
基于多视角边缘检测融合的放射性物品运输容器特征提取
6
作者 张沛东 肖连博 +4 位作者 张煜航 焦力敏 孙洪超 庄大杰 李国强 《包装工程》 北大核心 2025年第11期294-302,共9页
目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包... 目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包围立方体,并设计六自由度多视角正交投影系统,将三维点云降维映射至二维深度图,实现容器全表面覆盖;其次,基于拟合边缘模型及局部灰度面积效应,检测亚像素边缘点;进一步结合投影参数化映射与动态曲率插值算法,引入法向量连续性约束及加权融合策略,重构高保真三维特征点;最后,搭建实验系统,获取容器三维点云数据,基于简化率、配准误差及计算时间指标,并与现有点云特征提取方法进行对比。结果采用所提方法获取特征点云,其配准最大平均误差为1.33 mm,最大均方根误差为1.39 mm,简化率为1.6%。与其他文献的结果相比,所提方法的简化率更小,计算时间更短,且误差更小。结论所提方法有效解决了大规模点云处理与几何特征保真之间的矛盾,显著提升了放射性容器三维特征提取的精度和效率,为核能工程安全评估提供了可靠的几何形变量化分析技术支撑。 展开更多
关键词 放射性物品运输容器 三维形变测量 多视角深度图融合 亚像素边缘检测
在线阅读 下载PDF
融合自适应采样与全局感知的图像深度估计算法
7
作者 王国相 李昌隆 +2 位作者 宋俊锋 叶振 金恒 《计算机工程与应用》 北大核心 2025年第5期261-268,共8页
深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全... 深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全局感知的图像深度估计算法,由粗粒度到细粒度逐步预测深度图。通过引入预训练的深度补全网络预测粗粒度的稠密深度图,获取丰富的场景结构信息和语义信息。设计自适应深度采样方法,引导算法模型对远处的区域施加更多关注,缓解深度数据的长尾分布问题。同时通过新设计的全局感知模块,捕获并融合多尺度特征,从而获取更多的场景上下文信息。在NYU-Depth-v2数据集上的实验结果表明,算法在整体性能上超越了其他方法;消融实验的结果验证了提出的各个模块的有效性;Zero-shot实验的结果表明算法有较好的泛化性能,其中在ScanNet数据集上的阈值精度指标δ<1.25相比P3D方法提升了42个百分点,相比S2D方法则提升了3.8个百分点。 展开更多
关键词 深度估计 深度补全 稠密深度图 多尺度特征融合 自适应采样
在线阅读 下载PDF
动态环境下基于深度图的无人车激光SLAM算法 被引量:2
8
作者 孙明晓 王鑫源 +2 位作者 栾添添 王潇 刘鹏飞 《仪器仪表学报》 北大核心 2025年第3期101-109,共9页
针对激光SLAM在动态环境下出现精度下降与系统鲁棒性差的问题,故提出一种动态环境下基于深度图的无人车激光SLAM算法。首先,针对激光入射光线贴近地面时,部分地面点云会被误判为动态障碍物的问题,通过角度阈值将激光点云分割为地面点云... 针对激光SLAM在动态环境下出现精度下降与系统鲁棒性差的问题,故提出一种动态环境下基于深度图的无人车激光SLAM算法。首先,针对激光入射光线贴近地面时,部分地面点云会被误判为动态障碍物的问题,通过角度阈值将激光点云分割为地面点云与非地面点云,排除地面点云的影响。其次,将非地面点云投影为深度图,把三维空间中的点云投影到二维图像上,采用图像领域的方法减少点云数据处理的复杂度。然后,针对稀疏的激光点云不能准确反映真实环境的问题,利用激光雷达的距离信息作为自适应调节深度图的权重设置深度图的分辨率,使得在不同距离区间的深度图具有不同的分辨率,在不同的距离区间都能够准确识别出动态障碍物,提高系统识别动态障碍物的效率。最后,将局部地图与激光雷达查询帧所形成的深度图进行像素相减,通过得到的视差图去除动态障碍物,并通过降低深度图的分辨率恢复被误删的静态点,得到高精度静态地图。通过实验验证,在仿真环境中,本算法的动态障碍物移除分数为94.13%。在KITTI数据集中,本算法的动态障碍物移除分数为95.22%。在小场景环境和大场景环境中,本算法的动态障碍物移除分数分别为96.43%和93.30%。算法能高效去除动态障碍物,提高地图精度与系统鲁棒性。 展开更多
关键词 SLAM 动态环境 点云分割 深度图 无人车
原文传递
基于BSA-seq技术的块茎芽眼深度QTL定位分析
9
作者 邵顺伟 陈卓 +9 位作者 兰振东 蔡兴奎 邹华芬 李晨曦 唐景华 朱熙 张彧 董建科 金辉 宋波涛 《作物学报》 北大核心 2025年第7期1725-1735,共11页
芽眼深度是马铃薯块茎的重要性状之一,对马铃薯的外观品质及加工适宜性具有重要影响。为挖掘控制马铃薯芽眼深度的数量性状位点,本研究以四倍体深芽眼品种“华薯12”为母本、浅芽眼高代品系“天2002-4-5”为父本,杂交获得F_(1)代分离群... 芽眼深度是马铃薯块茎的重要性状之一,对马铃薯的外观品质及加工适宜性具有重要影响。为挖掘控制马铃薯芽眼深度的数量性状位点,本研究以四倍体深芽眼品种“华薯12”为母本、浅芽眼高代品系“天2002-4-5”为父本,杂交获得F_(1)代分离群体,共255份无性系。基于连续2年田间表型观测数据,分别选取20个深芽眼和20个浅芽眼个体构建混合池,利用BSA-seq技术进行芽眼深度相关性状的QTL定位,并结合传统QTL定位方法,采用完备区间作图法构建遗传连锁图谱,成功定位到2个与芽眼深度相关的QTL位点。2年表型相关性分析结果表明,马铃薯块茎芽眼深度主要受遗传因素的控制。10号染色体上qEyd10.1位点的LOD值为4.96,表型贡献率为14.49%;3号染色体上qEyd3.1位点的LOD值为3.29,表型贡献率为10.18%。其中, qEyd3.1与此前报道的芽眼深度调控位点一致,而qEyd10.1为新发现的QTL。2个位点的加性效应均为负值,表明降低芽眼深度的等位基因来源于浅芽眼亲本“天2002-4-5”。通过对定位区间内候选基因注释结合芽眼深浅材料基因结构变异分析,推测Soltu.DM.10G029390.1、Soltu.DM.03G036540.1、Soltu.DM.03G036140.1和Soltu.DM.03G036580.1可能为与芽眼深度相关的候选基因。本研究通过BSA-seq与传统QTL定位相结合的方式,快速完成了同源四倍体马铃薯中芽眼深度这一数量性状的调控位点定位工作,并初步确定了4个候选基因,为进一步完成芽眼深度调控基因的克隆及其遗传机制解析奠定了重要基础,也为培育具有浅芽眼块茎的四倍体马铃薯新品种提供了参考。 展开更多
关键词 马铃薯 芽眼深度 QTL定位 BSA-seq 遗传连锁图谱
在线阅读 下载PDF
基于特征点云配准的SLAM重建深度优化方法 被引量:1
10
作者 曹学伟 袁杰 梁荣光 《计算机工程与设计》 北大核心 2025年第3期657-664,共8页
针对视觉SLAM特征法中深度估计准确性和可靠性偏低的问题,提出一种基于特征点云配准的SLAM重建深度优化方法。利用SHOT特征描述子对三维点云提取特征,使用特征点云配准替代传统视觉特征法进行相机位姿估计。通过设定节点误差函数,优化... 针对视觉SLAM特征法中深度估计准确性和可靠性偏低的问题,提出一种基于特征点云配准的SLAM重建深度优化方法。利用SHOT特征描述子对三维点云提取特征,使用特征点云配准替代传统视觉特征法进行相机位姿估计。通过设定节点误差函数,优化视觉特征法建立的点云及其二义性点,建立带有纹理效果的稠密点云模型。在TUM和ICL-NUIM数据集上进行仿真实验,其结果表明,该方法相对于传统SLAM方法的相机位姿轨迹精度提升了10%。采用Kinect v2型RGB-D相机验证了该方法的有效性,实现了室内场景具有一定纹理效果的模型建立。 展开更多
关键词 点云配准 相机位姿估计 深度优化 稠密建图 同时定位与地图构建 点云地图 点云特征
在线阅读 下载PDF
基于雾天模拟图像的能见度估计方法研究
11
作者 邱实卓 叶青 +1 位作者 黄佳恒 刘建平 《电光与控制》 北大核心 2025年第3期94-100,共7页
针对带有能见度标签的雾天图像数据集匮乏的问题,提出一种基于雾天模拟图像的能见度检测方法。通过无监督深度估计模型构建户外清晰图像的深度图,并且利用特征融合来细化深度图细节,采用暗通道法筛选天空区域估计大气光值,获得设定能见... 针对带有能见度标签的雾天图像数据集匮乏的问题,提出一种基于雾天模拟图像的能见度检测方法。通过无监督深度估计模型构建户外清晰图像的深度图,并且利用特征融合来细化深度图细节,采用暗通道法筛选天空区域估计大气光值,获得设定能见度下户外图像的透射率图,进一步获得带有不同能见度标签的雾天模拟图像数据集,基于此利用改进后的ShuffleNet V2网络训练能见度估计模型。对数据集和真实雾天图像进行了能见度等级估计的验证实验,实验结果表明,对能见度小于500 m的雾天图像具有良好的能见度估测结果,对小于200 m的检测准确率高于90%,总体准确率为87.8%,表明该方法具有可行性,可用于大雾条件下的道路能见度等级估测。 展开更多
关键词 雾天模拟 深度图 特征融合 ShuffleNet V2 能见度估计
在线阅读 下载PDF
基于结构纹理分解的深度图超分辨率重建
12
作者 唐思远 孙涛 +2 位作者 付柏 殷杰 张国荣 《武汉大学学报(工学版)》 北大核心 2025年第4期665-676,共12页
彩色图像引导的深度图超分辨率重建能有效解决深度相机采集深度图时分辨率低和无效空洞的问题。然而,由于彩色图和深度图的结构不一致性,此类方法容易产生纹理转移伪影。针对此问题,提出了基于结构纹理分解的加权最小二乘(structure tex... 彩色图像引导的深度图超分辨率重建能有效解决深度相机采集深度图时分辨率低和无效空洞的问题。然而,由于彩色图和深度图的结构不一致性,此类方法容易产生纹理转移伪影。针对此问题,提出了基于结构纹理分解的加权最小二乘(structure texture decomposition based weighted least square,STDWLS)深度超分辨率重建算法。该方法首先使用原深度图引导彩色图片结构纹理分解得到结构图,随后使用加权最小二乘优化框架来同时建模深度图上采样和空洞填充问题,并对有效深度值和空洞区域分别构建相应的惩罚函数。具体而言,对于有效深度值,该方法结合静态的结构图和动态更新的深度值计算引导权重;对于空洞,该方法仅使用结构图计算引导权重,并加入边缘自适应窗口来防止深度图边缘模糊。实验结果表明,STDWLS算法能够同时完成深度图上采样和空洞填充任务,有效抑制了纹理转移伪影,提高了深度图重建的精确度与表面结构相似度。 展开更多
关键词 深度图超分辨率重建 空洞填充 纹理结构分解 加权最小二乘
原文传递
互补跨模态交互的RGB-D显著目标检测网络
13
作者 王双凤 吴观茂 +1 位作者 周华平 孙克雷 《阜阳师范大学学报(自然科学版)》 2025年第1期23-29,共7页
由于RGB和深度模态包含不同的特征,因此如何有效融合多模态信息和跨阶段特征的交互是RGB-D显著目标检测的关键问题。为此,本文提出一种互补跨模态交互的RGB-D显著目标检测网络,该模型由多模态交互注意力编码器和渐进金字塔解码器两部分... 由于RGB和深度模态包含不同的特征,因此如何有效融合多模态信息和跨阶段特征的交互是RGB-D显著目标检测的关键问题。为此,本文提出一种互补跨模态交互的RGB-D显著目标检测网络,该模型由多模态交互注意力编码器和渐进金字塔解码器两部分组成,编码器部分引入RGB诱导细节增强模块和深度诱导语义增强模块,模拟了不同卷积层中RGB和深度模态的互补性来实现跨模态信息交互。此外,引入渐进金字塔解码器能够进一步提取更多有用的特征来增强模型预测,保证特征兼容性。实验结果表明,与其他方法对比,本文方法具有较好效果。 展开更多
关键词 深度图 跨模态 渐进金字塔 信息交互
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
14
作者 贾克斌 吴岳珩 《北京工业大学学报》 北大核心 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
多传感器融合的无人车SLAM系统研究
15
作者 吴文昊 谷玉海 《重庆理工大学学报(自然科学)》 北大核心 2025年第1期229-235,共7页
为提高无人车的避障能力,使其能够在构建的地图环境中高效地进行自动定位和路径规划,提出一种多传感器融合的无人车SLAM系统。对于障碍物监测,采用激光雷达与深度相机信息融合的方法构建地图,以融合得到更精准的栅格图。搭建了履带式差... 为提高无人车的避障能力,使其能够在构建的地图环境中高效地进行自动定位和路径规划,提出一种多传感器融合的无人车SLAM系统。对于障碍物监测,采用激光雷达与深度相机信息融合的方法构建地图,以融合得到更精准的栅格图。搭建了履带式差速底盘运动学模型,通过融合IMU数据提高位姿估计精度;分析了贝叶斯推理方法,在决策层以该方法有效融合激光雷达与深度相机的数据;提出基于卡尔曼滤波算法动态调整权重将雷达与相机的后验概率融合,得到最终的地图栅格信息。最后,根据融合后的数据构建地图并实现自主导航的功能。通过对比实验发现,改进的多传感器融合建图算法定位精度综合提高了91.67%,实时的整体性能提升了54.46%,栅格建图完整性提升了6.59%。 展开更多
关键词 贝叶斯算法 融合建图 激光雷达 深度相机 ROS2
在线阅读 下载PDF
激光雷达点云球面投影与相机融合的环境语义分割算法
16
作者 杨涵 高骏 +6 位作者 刘勇 贺秀伟 檀利 殷艳坤 申晓雷 杨菲菲 彭成磊 《装备环境工程》 2025年第7期9-15,共7页
目的 融合激光雷达与相机的多模态信息,完成语义分割任务。方法 通过球面投影,将激光雷达三维点云转化为二维稀疏深度图,与相机图像实现像素级对齐。在神经网络模型中,设计非对称双分支编码器,使用稀疏卷积提取深度图特征,使用残差结构... 目的 融合激光雷达与相机的多模态信息,完成语义分割任务。方法 通过球面投影,将激光雷达三维点云转化为二维稀疏深度图,与相机图像实现像素级对齐。在神经网络模型中,设计非对称双分支编码器,使用稀疏卷积提取深度图特征,使用残差结构提取相机图像特征,2种模态的特征通过融合网络实现特征混合,得到融合图像。对融合图像使用基于跳跃连接的解码器解析特征,恢复分辨率并生成语义分割结果。结果 设计的算法有效提取和融合了2种模态的特征,降低了环境因素对单传感器的干扰,提高了语义分割的精确度和稳健性。算法在KITTI数据集上的mIoU指标达到了64.4%,较传统单模态环境语义分割算法提升了8.6%,且受光照影响更小。结论 相机的色彩纹理信息与激光雷达的精确深度信息具备信息维度互补能力,本文设计的多模态融合环境语义分割算法有效完成了环境语义分割任务,具备较高的精确度与稳健性。 展开更多
关键词 语义分割 环境感知 多模态感知 深度学习 特征融合 激光雷达 深度图
在线阅读 下载PDF
融合视觉注意力的粉尘图像深度估计
17
作者 宋曜宇 王园宇 +1 位作者 王勤 张彤 《太原理工大学学报》 北大核心 2025年第6期1110-1117,共8页
【目的】与雾霾不同,粉尘分布常是非均匀的和局部的,其对光线的散射与吸收缺乏有效的模型描述,这给依赖图像特征的深度估计造成了严重影响。针对这一问题,提出了一种融合视觉注意力的粉尘图像深度估计方法。【方法】在该方法中,构建了... 【目的】与雾霾不同,粉尘分布常是非均匀的和局部的,其对光线的散射与吸收缺乏有效的模型描述,这给依赖图像特征的深度估计造成了严重影响。针对这一问题,提出了一种融合视觉注意力的粉尘图像深度估计方法。【方法】在该方法中,构建了粉尘在图像中的分布模型,并据此设计了视觉注意力网络模块,用于得到粉尘区域的注意力图,从而引导深度估计网络加强对粉尘区域的图像深度特征提取。此外,为了提升粉尘图像的深度特征提取能力,设计了一个多尺度特征提取模块。将以上模块加入到生成对抗网络框架中,并结合面向粉尘图像深度估计目标设计的损失函数,实现了单幅粉尘图像的深度估计。【结果】在NYU Depth v2数据集上实验的结果表明,本方法取得的平均相对误差、对数平均误差、均方根误差分别为0.189、0.052和0.508,比目前一些先进算法对粉尘图像的深度估计更为准确;在真实数据上的对比实验也验证了本方法具有更优的泛化能力。 展开更多
关键词 深度估计 粉尘图像 注意力图
在线阅读 下载PDF
基于双流聚合Transformer的RGB-D语义分割
18
作者 葛梦娇 苏雯 +2 位作者 何烨 陈稼炜 高金凤 《电子科技》 2025年第12期79-85,共7页
针对RGB-D(Red Green Blue Depth)语义分割中色彩信息和深度信息无法有效融合以及无法充分提取多尺度上下文信息的问题,文中提出了一种基于双流聚合Transformer的RGB-D语义分割方法。通过Transformer提取全彩图像和深度图像的多层次特征... 针对RGB-D(Red Green Blue Depth)语义分割中色彩信息和深度信息无法有效融合以及无法充分提取多尺度上下文信息的问题,文中提出了一种基于双流聚合Transformer的RGB-D语义分割方法。通过Transformer提取全彩图像和深度图像的多层次特征,采用通道注意交叉融合模块与深度增强RGB操作实现各层次特征模态鸿沟的补偿,完成双模态信息融合。使用多层聚合解码器模块整合多层次多尺度上下文特征,减少了信息传递损失,实现了更准确和更全面的语义分割。实验结果表明,所提方法在NYU-Dv2数据集上的平均交并比(mean Intersection over Union,mIoU)、像素准确率和平均像素准确率分别达到52.9%、78.0%、66.0%。在Cityscapes数据集上的实验结果表明,在低分辨率输入图像下,所提方法的mIoU达到了79.8%。 展开更多
关键词 RGB-D 语义分割 TRANSFORMER 通道注意交叉融合 深度增强RGB操作 多层聚合解码器 全彩图像 深度图像
在线阅读 下载PDF
LpDepth:基于拉普拉斯金字塔的自监督单目深度估计
19
作者 曹明伟 邢景杰 +1 位作者 程宜风 赵海锋 《计算机科学》 北大核心 2025年第3期33-40,共8页
自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影... 自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影响深度图的精度。针对上述问题,提出一种基于拉普拉斯金字塔的自监督单目深度估计方法(Self-supervised Monocular Depth Estimation Based on the Laplace Pyramid,LpDepth)。此方法的核心思想是:首先,使用拉普拉斯残差图丰富编码特征,以弥补在下采样过程中丢失的特征信息;其次,在下采样过程中使用最大池化层突显和放大特征信息,使编码器在特征提取过程中更容易地提取到训练模型所需要的特征信息;最后,使用残差模块解决过拟合问题,提高解码器对特征的利用效率。在KITTI和Make3D等数据集上对所提方法进行了测试,同时将其与现有经典方法进行了比较。实验结果证明了所提方法的有效性。 展开更多
关键词 单目深度估计 拉普拉斯金字塔 残差网络 深度图
在线阅读 下载PDF
基于单目视觉SLAM的无人机视频实时建图框架
20
作者 孙一铭 张璐 +3 位作者 马腾飞 张海瑞 程傲楠 刘见礼 《测绘科学》 北大核心 2025年第5期167-176,共10页
针对在应急救灾和军事侦察等场景中,需要实时生成地图产品,传统基于运动恢复结构(SFM)的方法仅支持离线处理的问题,提出一种基于单目视觉SLAM的无人机视频实时建图框架。该框架能够实时处理无人机视频帧和GNSS/INS位姿数据,快速生成密... 针对在应急救灾和军事侦察等场景中,需要实时生成地图产品,传统基于运动恢复结构(SFM)的方法仅支持离线处理的问题,提出一种基于单目视觉SLAM的无人机视频实时建图框架。该框架能够实时处理无人机视频帧和GNSS/INS位姿数据,快速生成密集点云、数字表面模型(DSM)及数字正射影像图(DOM)。关键处理模块包括位姿解算、三维重建和地图生成。在3个不同样区的实地测试结果表明,生成的DSM的平均高程精度在2 m以内,DOM的平均平面精度在1 m以内,可以满足应急应用场景的精度需求。在效率方面,处理时间相对于飞行时间的平均延迟为4.66%,基本实现实时处理的目标。对比实验结果显示,本研究提出的框架在性能上优于先进的OpenREALM框架。 展开更多
关键词 视觉SLAM 无人机视频 位姿融合 深度图 密集点云 DSM DOM
原文传递
上一页 1 2 31 下一页 到第
使用帮助 返回顶部