期刊文献+
共找到207篇文章
< 1 2 11 >
每页显示 20 50 100
基于低成本多视角立体视觉的辣椒苗三维重建与策略优化
1
作者 朱磊 程瑞英 +3 位作者 丁一民 孙振源 郭政 江伟 《中国农村水利水电》 北大核心 2025年第4期123-129,共7页
基于立体视觉的三维重建技术有效降低了植株表型无损测量中的影像获取成本,但算力消耗较大。开展三维重建策略优化研究,对于提高植株表型信息的采集效率具有重要意义。研究构建了以手机为影像获取手段的多视角成像系统,获取了30株辣椒... 基于立体视觉的三维重建技术有效降低了植株表型无损测量中的影像获取成本,但算力消耗较大。开展三维重建策略优化研究,对于提高植株表型信息的采集效率具有重要意义。研究构建了以手机为影像获取手段的多视角成像系统,获取了30株辣椒苗的影像数据,进一步结合运动恢复结构与多视图立体视觉(SFM-MVS,Structure From Motion-MultiPle View Stereo)算法,在2160个不同分辨率和不同数量影像组合情景下,分别重建了辣椒苗三维点云。通过重建速度、精度、稳定性以及植株表型参数(叶长、叶宽)准确性的评估,优化植株三维点云重建方案。结果表明,当分辨率为480 p,图片数量大于45幅时,重建成功率达到80%,点云间平均距离误差均小于0.05 cm,提取的表型参数值与实测值的R2均到了0.96以上。同时,该情景下单株平均重建时间为344 s,仅为参照情景(分辨率为1080 p、图片数量为120幅)耗时的10%。综上,在辣椒苗的重建中可将分辨率和图像数量分别设置为480 p和45,从而优化表型测量效率。研究结果可为基于三维重建的辣椒苗表型参数快速无损测量提供参考。 展开更多
关键词 三维重建 多视角立体视觉 点云模型 表型参数
在线阅读 下载PDF
基于多目近红外视觉的多目标实时跟踪方法
2
作者 陈忠 王傲辰 +2 位作者 高心怡 何利辉 张宪民 《华南理工大学学报(自然科学版)》 北大核心 2025年第7期31-38,共8页
近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成... 近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成像特性,利用灰度质心法提取各个反光标记球的几何中心,然后在各单目相机中使用SORT算法作为多目标跟踪方法对各个标记点进行帧间匹配,并根据对极几何原理,结合带权二分图匹配方法确定反光标记球在各个相机中像点的匹配关系,依据三角测量方法实时计算各个受跟踪反光标记球的三维空间坐标;其次,根据运动过程中各反光标记球之间的空间位置关系对反光标记球进行分组,识别属于同一物体的反光标记球,并根据同组反光标记球间的欧氏距离建立被跟踪物体与反光标记球的外观特征向量,以此作为物体丢失重现的匹配依据,而完全丢失后再重现的被跟踪物体利用外观特征向量的余弦距离进行重匹配;最后,对所提方法进行实验验证。实验结果表明:所提方法在不小于60 f/s的帧率下的跟踪精度约可达0.5 mm;另外,其可以对丢失的重现物体以及反光标记球进行正确的重匹配。 展开更多
关键词 多目视觉 近红外光学跟踪 立体匹配 反光标记球
在线阅读 下载PDF
基于双目BEV与改进YOLOv8的路面裂缝识别方法
3
作者 谢海波 邱杨航 +4 位作者 黄莹颖 张汇祥 蔡生勇 王培玉 萧白 《长沙理工大学学报(自然科学版)》 2025年第5期1-16,共16页
【目的】针对路面裂缝检测过程中目标尺度不一致、全局特征建模能力不足的问题,提出一种基于双目鸟瞰图(bird’s eye view,BEV)与改进YOLOv8模型的路面裂缝识别方法,旨在实现高效、精准的裂缝检测与分割。【方法】首先,通过双目立体视... 【目的】针对路面裂缝检测过程中目标尺度不一致、全局特征建模能力不足的问题,提出一种基于双目鸟瞰图(bird’s eye view,BEV)与改进YOLOv8模型的路面裂缝识别方法,旨在实现高效、精准的裂缝检测与分割。【方法】首先,通过双目立体视觉与逆透视变换技术生成高精度BEV图像,解决传统视角下目标尺度不一致问题;其次,提出的C2f-DRR模块利用区域残差化-语义残差化的解耦策略有效捕获裂缝的多尺度上下文信息,通过大核卷积与小核空洞卷积协同作用丰富图像的细节信息并减少背景干扰;最后,引入上下文锚点注意力机制,使模型能够动态聚焦裂缝中心区域,并实现对远距离像素间的长程依赖关系的建模。【结果】为验证改进模型的有效性,在测试集上进行了对比试验。改进后模型的平均精度均值MAP50达83.7%,准确率P达83.9%,F1分数达83.5%,较原始的YOLOv8n模型的分别提升4.4、4.0、1.8个百分点。在公开数据集UAV-PDD2023上验证的MAP50达70.5%,召回率R达64.8%,准确度P达74.1%,较原模型的分别提升了3.5、4.5、0.6个百分点。改进模型在识别精度、鲁棒性、泛化学习能力方面均优于原始模型。【结论】本研究提出的基于双目BEV视角的裂缝分割方法有效提升了模型在复杂道路场景下的检测精度与泛化能力,为自动化路面病害检测提供了技术支持。 展开更多
关键词 路面裂缝识别 双目立体视觉 鸟瞰图 YOLOv8 上下文锚点注意力 特征提取
在线阅读 下载PDF
基于深度学习的多视图立体视觉综述 被引量:1
4
作者 樊铭瑞 申冰可 +3 位作者 牛文龙 彭晓东 谢文明 杨震 《软件学报》 北大核心 2025年第4期1692-1714,共23页
多视图立体视觉在自动驾驶、增强现实、遗产保护和生物医学等领域得到广泛应用.为了弥补传统多视图立体视觉方法对低纹理区域不敏感、重建完整度差等不足,基于深度学习的多视图立体视觉方法应运而生.对基于深度学习的多视图立体视觉方... 多视图立体视觉在自动驾驶、增强现实、遗产保护和生物医学等领域得到广泛应用.为了弥补传统多视图立体视觉方法对低纹理区域不敏感、重建完整度差等不足,基于深度学习的多视图立体视觉方法应运而生.对基于深度学习的多视图立体视觉方法的开创性工作和发展现状进行综述,重点关注基于深度学习的多视图立体视觉局部功能改进和整体架构改进方法,深入分析代表性模型.同时,阐述目前广泛使用的数据集及评价指标,并对比现有方法在数据集上的测试性能.最后对多视图立体视觉未来有前景的研究发展方向进行展望. 展开更多
关键词 深度学习 计算机视觉 三维重建 多视图立体视觉
在线阅读 下载PDF
融合上下文引导代价体和深度细化的多视图立体重建
5
作者 陈光远 王朝辉 程泽 《计算机科学》 北大核心 2025年第3期231-238,共8页
针对基于深度学习的多视图立体(Multi-view Stereo,MVS)重建算法仍然存在图像特征提取不全面、代价体匹配模糊以及深度误差不断积累而导致在无纹理和重复纹理区域重建效果差的问题,提出了基于上下文引导的代价体构建和深度细化的级联MV... 针对基于深度学习的多视图立体(Multi-view Stereo,MVS)重建算法仍然存在图像特征提取不全面、代价体匹配模糊以及深度误差不断积累而导致在无纹理和重复纹理区域重建效果差的问题,提出了基于上下文引导的代价体构建和深度细化的级联MVS网络。首先,利用基于无参注意力的特征融合模块过滤无用特征并通过特征融合来解决多尺度特征不一致的问题;然后,利用基于上下文引导的代价体模块融合全局信息来提高代价体匹配的完整性和鲁棒性;最后,利用深度细化模块学习深度残差来提升低分辨下深度图的准确性。实验结果表明,在DTU数据集上,该网络相比MVSNet完整度误差减小了24.4%,准确度误差减小了4.1%,整体误差减小了14.3%,其在Tanks and Temples数据集上性能也优于大多数算法,展现出强大的竞争力。 展开更多
关键词 多视图立体 特征融合 上下文引导 代价体匹配 深度细化
在线阅读 下载PDF
基于无人机与深度学习的森林特征参数估测模型构建与可解释性研究
6
作者 孙钊 谢运鸿 +3 位作者 丁志丹 李睿 谭军 袁新 《农业机械学报》 北大核心 2025年第11期397-407,共11页
森林特征参数是评估森林生态系统生长状况的关键指标,为高效、精确地估测森林特征参数,本研究探索结合无人机技术和DNN(Deep neural network)模型的森林特征参数的估测方法,并通过SHAP(Shapley additive explanations)方法提高模型预测... 森林特征参数是评估森林生态系统生长状况的关键指标,为高效、精确地估测森林特征参数,本研究探索结合无人机技术和DNN(Deep neural network)模型的森林特征参数的估测方法,并通过SHAP(Shapley additive explanations)方法提高模型预测的可解释性。使用无人机高分辨率影像作为数据源,利用DNN对平均胸径(Average diameter at breast height,AD)、林分胸高断面积(Area of forest stand at breast height,BA)、Lorey's树高(Lorey's tree heights,HL)、样地地上生物量(Above-ground biomass of sample plots,AGB)等森林特征参数进行估测。设计了多层次的DNN模型处理和分析影像数据,预测森林特征参数。同时,采用SHAP方法对DNN模型的预测结果进行可解释性分析,以理解每个特征在模型预测中的作用。深度学习DNN模型可以利用DAP(Digital aerial photograph)数据中获取的二维光谱特征和三维点云特征进行森林特征参数的估测模型构建。BA和AGB参数的估测模型性能从大到小为DOM+DAP点云、DOM(Digital orthophoto mosaic)、DAP点云,BA和AGB最优模型的R2平均值分别为0.7438、0.7762,而AD和HL的参数估测模型性能从大到小排序为DOM+DAP点云、DAP点云、DOM,AD和HL最优模型的R2平均值分别为0.6133、0.7276。SHAP值反映了每个特征变量对预测结果的贡献,树高变异系数在各模型中均占据了较为重要的位置,点云高度变量对特征参数具有更高的解释能力。DNN模型具有较高的估测精度,而SHAP方法提升了模型预测结果的解释性,同时强调了点云变量在整体预测模型中的重要性。这表明现代遥感技术与先进的机器学习方法相结合,可为利用无人机数字航空摄影技术进行森林资源调查监测提供必要的技术支持。 展开更多
关键词 森林特征参数 深度学习 SfM算法 多视角立体视觉技术 SHAP可解释性分析
在线阅读 下载PDF
自适应深度一致与跨频注意力的多视立体网络
7
作者 邢航 王刚 +1 位作者 王岩 侯明辉 《吉林大学学报(信息科学版)》 2025年第4期724-735,共12页
针对当前深度学习在三维重建中难以从图像中提取全面的场景信息,以及未充分考虑视图间的深度一致性问题,提出具有自适应深度一致性和跨频注意力的多视图立体网络(ADCFA-MVSNet:Multi-View Stereo with Adaptive Depth Consistency and C... 针对当前深度学习在三维重建中难以从图像中提取全面的场景信息,以及未充分考虑视图间的深度一致性问题,提出具有自适应深度一致性和跨频注意力的多视图立体网络(ADCFA-MVSNet:Multi-View Stereo with Adaptive Depth Consistency and Cross-Frequency Attention)。跨频注意力(CFA:Cross-Frequency Attention)模块整合图像内高频和低频信息,以及跨视图的全局场景信息,能更加全面地提取图像特征。自适应深度一致性(AD:Adaptive Depth Consistency)模块精确捕捉场景中的几何结构,动态考虑不同视图对深度一致性的贡献,在不同尺度上增强深度一致性。其创新之处在于利用全面的图像信息,确保几何一致性,从而在3D重建任务中取得优异的表现。实验结果表明,在DTU(Technical University of Denmark)数据集上精确度为0.319,完整度为0.285,整体得分为0.302,优于其他对比方法。在BlendedMVS数据集上,EPE(End-Point-Error)得分为0.27,e1得分为5.28,e3得分为1.84,同样优于对比方法。证明了ADCFA-MVSNet在提升多视图三维重建的完整度和精度方面的有效性,提高了多视图重建质量,取得了良好的重建效果。 展开更多
关键词 计算机视觉 多视图立体视觉 深度学习 跨频注意力 自适应深度一致性
在线阅读 下载PDF
基于视差估计网络的多视卫星影像稠密匹配及DSM生成
8
作者 姜楠 史长斌 +3 位作者 蔡文婧 曲英杰 刘海兵 邓非 《测绘科学》 北大核心 2025年第6期91-102,共12页
针对多时相卫星影像因光照和季节变化呈现动态特征,而传统立体匹配方法基于场景静态假设,导致匹配精度和完整性不足的问题,该文提出了一种基于深度学习视差估计网络的卫星立体匹配方法(DLSSM)。首先采用HMSM-NET网络,替代传统的匹配算法... 针对多时相卫星影像因光照和季节变化呈现动态特征,而传统立体匹配方法基于场景静态假设,导致匹配精度和完整性不足的问题,该文提出了一种基于深度学习视差估计网络的卫星立体匹配方法(DLSSM)。首先采用HMSM-NET网络,替代传统的匹配算法,通过构建多尺度金字塔特征和学习多尺度对应关系,增强网络在视差不连续和遮挡区域的处理能力,提升视差估计的准确性,最后通过有理多项式系数(RPC)三角化获取三维点云。另外,该文提出一种自适应点云聚类的DSM生成方法(ADG),融合多组立体匹配的点云并栅格化,对DSM栅格中的三维点进行滤波和聚类分析,并自适应地选择网格最优的高程值,从而提高DSM在边缘处的精度。在US3D和MVS3DM数据集上的实验表明,DLSSM方法具有较好的泛化能力,与传统的DSM融合方法相比,ADG方法生成的DSM边界更清晰和准确,与商业软件相比,该文方法的DSM细节更多且精度更高。 展开更多
关键词 光学卫星影像 多视图匹配 立体匹配 深度学习 视差估计 自适应DSM生成
原文传递
基于内窥镜图像的儿童腺样体场景三维重建
9
作者 许涛 王顺成 +3 位作者 钟建文 刘大波 周宜龙 刘畅 《集成技术》 2025年第1期65-77,共13页
腺样体肥大是导致儿童阻塞性睡眠呼吸暂停综合征的主要因素。医生通过内窥镜影像评估腺样体肥大程度及其对气道的阻塞程度。然而,内窥镜影像为二维图像,医生只能主观推测患者腺样体区域的三维结构。这种方法严重依赖医生的相关经验和对... 腺样体肥大是导致儿童阻塞性睡眠呼吸暂停综合征的主要因素。医生通过内窥镜影像评估腺样体肥大程度及其对气道的阻塞程度。然而,内窥镜影像为二维图像,医生只能主观推测患者腺样体区域的三维结构。这种方法严重依赖医生的相关经验和对腺样体的观察角度。腺样体表面为人体黏膜组织,覆盖鼻腔分泌物,其内窥镜影像具有强反光、特征稀少、场景光滑、模糊等特点。根据腺样体表面特点,该文提出一种基于腺样体鼻咽腔内镜图像序列的多视图三维重建算法。算法首先采用多视图立体匹配技术获取图像对应深度图的粗糙估计;其次,使用网格曲面在深度空间中对粗糙的深度信息进行拟合,从而得到平滑、精细的深度图;最后,通过点云融合算法获得腺样体区域稠密、精确的三维重建。仿真与真实实验表明,该文算法基于腺样体内窥镜图像序列,可实现精确、稠密、平滑的腺样体区域三维重建,且重建结果显著优于现有三维重建算法。 展开更多
关键词 腺样体 三维重建 曲面拟合 多视图立体重建
在线阅读 下载PDF
Theory and Practice of the Stereo-View on the CRT Screen
10
作者 夏运钧 《Journal of Computer Science & Technology》 SCIE EI CSCD 1996年第5期519-528,共10页
Of the various kinds of research on the Virtual Reality and GIS, stereo-view is one of the key technologies . The following two aspects are covered in this paper. (1)Physiological fundamental of the natural binocular ... Of the various kinds of research on the Virtual Reality and GIS, stereo-view is one of the key technologies . The following two aspects are covered in this paper. (1)Physiological fundamental of the natural binocular stereo-vision, theory of 3D color TV and the stereo-view on the CRT screen are presented, especially the theory of widely adopted Time-Division System is introduced. (2) The preliminary practice for using the sterecrview technology on the screen to the terrain visual simulation is described, and the paper shows how to use 3DS to construct a movable real stereo terrain perspective by taking DTM data as the first hand information for the purpose of terrain visual simulation. 展开更多
关键词 STEREO-VISION stereo-view on the CRT screen FMSS LCD shutter glasses time-division 3D color TV terrain visual simulation
原文传递
基于特征映射的多目立体视觉接触网几何参数检测技术
11
作者 薛宪堂 周威 +5 位作者 秦哲 杜馨瑜 张翼 王燕国 刘春浩 赵权 《中国铁路》 北大核心 2025年第9期107-115,共9页
目前基于多目视觉的接触网几何参数测量系统存在非工作支测量范围较小的问题,因此研究基于标定特征映射矩阵的多目立体视觉技术,对接触网几何参数检测系统进行优化。该检测系统能够通过标定数据,实现4套特征映射矩阵组和相机模型参数的... 目前基于多目视觉的接触网几何参数测量系统存在非工作支测量范围较小的问题,因此研究基于标定特征映射矩阵的多目立体视觉技术,对接触网几何参数检测系统进行优化。该检测系统能够通过标定数据,实现4套特征映射矩阵组和相机模型参数的标定。优化后接触网几何参数测量方法主要包括图像预处理、特征映射矩阵约束检查、车顶几何参数计算等。试验结果表明:测量的导高和拉出值参数满足技术条件,对接触线的非工作支识别效果较好,能够提高接触网几何参数的测量范围。 展开更多
关键词 接触网 几何参数 特征映射 多目立体视觉 非工作支
在线阅读 下载PDF
基于零均值归一化互相关的弱纹理区多视角立体视觉
12
作者 李仪 蔡砚刚 +3 位作者 王泽梁 凌智蕾 赵宇环 汪翰 《信息传播研究》 2025年第5期52-60,共9页
多视角立体视觉(MVS,multi-view stereo)在计算机视觉领域,尤其是在深度估计和三维重建中扮演着至关重要的角色。基于PatchMatch的方法是MVS的一个重要分支,其中光度一致性直接影响深度信息的传播和更新,是确保跨不同视图准确匹配的关... 多视角立体视觉(MVS,multi-view stereo)在计算机视觉领域,尤其是在深度估计和三维重建中扮演着至关重要的角色。基于PatchMatch的方法是MVS的一个重要分支,其中光度一致性直接影响深度信息的传播和更新,是确保跨不同视图准确匹配的关键因素。本文提出了一种基于PatchMatch的改进型多视角立体匹配方法。首先,在代价计算阶段,为了增强匹配的鲁棒性,本文提出了一种结合双边权重的零均值归一化互相关(ZNCC,zero-mean normalized cross-correlation)代价计算方法。该方法在计算局部图像块的统计量时,不仅考虑像素间的空间距离,还引入了颜色相似性度量。这种双边加权策略使得代价计算能够有效应对线性的光照和对比度变化,同时在深度不连续的边缘区域表现出更强的鲁棒性,减少了前景与背景之间的错误匹配。其次,在代价传播阶段,针对传统PatchMatch方法中采样策略无法兼顾不同纹理区域特性的问题,本文设计了一种自适应纹理感知采样策略。该策略通过计算局部图像梯度的方差来对像素进行纹理复杂度分析,将其动态划分为纹理丰富区域和低纹理区域。对于纹理丰富区域,采用局部主导的采样模式以精确恢复几何细节;对于低纹理区域,则采用混合局部与非局部采样模式,在借鉴远处有效几何信息的同时保留局部平滑传播,从而有效提升了在弱纹理表面上的重建完整性和稳定性。在ETH3D和Tanks&Temples数据集上的实验结果表明,与State-of-the-Art方法相比,本文所提出的方法将F1分数提高了2.5%,重建完整性提高了4.9%,尤其在光照变化的弱纹理区域表现出鲁棒性。该方法为MVS研究提供了新的视角,并促进了基于PatchMatch算法的发展。 展开更多
关键词 多视角立体视觉 PatchMatch 三维重建
在线阅读 下载PDF
多阶段协同的多视图立体算法研究
13
作者 朱治年 刘韵婷 +2 位作者 肖培宇 李思维 刘欣然 《通信与信息技术》 2025年第2期28-32,共5页
多视图立体匹配(Multi-View Stereo)是计算机视觉领域的重要任务之一,旨在从多个视角的图像中恢复场景的结构信息。然而,由于成本体积聚合在局部存在着严重的不一致性,直接聚合几何相邻成本会导致严重错误导向。现有的方法要么寻求二维... 多视图立体匹配(Multi-View Stereo)是计算机视觉领域的重要任务之一,旨在从多个视角的图像中恢复场景的结构信息。然而,由于成本体积聚合在局部存在着严重的不一致性,直接聚合几何相邻成本会导致严重错误导向。现有的方法要么寻求二维空间的最优选择性聚集,要么增加聚集的手段,但都无法有效解决成本体积的几何不一致性,导致深度估计的精度和鲁棒性不佳。为了解决这个问题,提出用于多视图立体的协同表达(CRMVS),旨在协同多个模块整合几何的一致性信息,提高多视图立体匹配任务的深度估计精度和鲁棒性。首先,利用改进的特征金字塔网络(FPN)增强网络的特征提取能力。其次,设计了一个渐进式权重网络模块(PWN)进行代价体的构建。最后,设计了一个几何代价聚合与精化网络模块(GCR)来对代价体进行精准聚合。实验结果表明在DTU,Tanks&Temple数据集上都展现出了先进的性能。 展开更多
关键词 多视图立体匹配 特征金字塔 代价体 成本聚合
在线阅读 下载PDF
融合上下文增强与图像频率引导的MVS方法
14
作者 陈曦 刘美 陈嘉升 《计算机系统应用》 2025年第3期259-267,共9页
基于学习的多视图立体匹配算法目前成果显著,但是仍然存在的卷积感受野受限以及忽略图像频率信息导致在低纹理、重复和非兰伯曲面匹配性能不足的问题,针对以上问题提出了上下文增强与图像频率引导的多视图立体匹配网络CAF-MVSNet.首先,... 基于学习的多视图立体匹配算法目前成果显著,但是仍然存在的卷积感受野受限以及忽略图像频率信息导致在低纹理、重复和非兰伯曲面匹配性能不足的问题,针对以上问题提出了上下文增强与图像频率引导的多视图立体匹配网络CAF-MVSNet.首先,在特征提取阶段,将上下文增强模块融合到特征金字塔网络中,有效地扩大网络的感受野.然后引入了图像频率引导注意力模块,通过编码图像的不同频率获取图像的线条、形状、纹理和颜色等信息,增强图像的远程上下文联系的同时进一步解决低纹理、重复和非兰伯曲面的精确匹配问题,以实现可靠的特征匹配.在DTU数据集上的实验结果显示,与经典的级联模型Cas MVSNet相比综合误差(overall)提升了12.3%,展现了优秀的性能.此外,在Tanks and Temples数据集上也取得了不错的效果,展现了良好的泛化性能. 展开更多
关键词 多视图立体匹配 三维重建 上下文增强 图像频率引导 深度学习
在线阅读 下载PDF
面向神经隐式表面重建的层次化体素编码
15
作者 顾小东 关凯 潘健雄 《计算机系统应用》 2025年第11期68-81,共14页
神经隐式表面重建技术在从图像中恢复精细三维形状方面取得了显著进展,但现有方法主要依赖多层感知机(MLP)进行场景编码,缺乏显式的三维结构信息,导致重建结果在几何细节和全局一致性上存在不足.为解决该问题,本研究提出了一种面向神经... 神经隐式表面重建技术在从图像中恢复精细三维形状方面取得了显著进展,但现有方法主要依赖多层感知机(MLP)进行场景编码,缺乏显式的三维结构信息,导致重建结果在几何细节和全局一致性上存在不足.为解决该问题,本研究提出了一种面向神经隐式表面重建的层次化体素编码方法.该方法通过设计一种多尺度体素编码策略,显式地将空间信息嵌入到神经隐式表示中:高分辨率体素捕捉高频几何细节,学习空间变化的特征;低分辨率体素则通过在相邻位置共享特征来保持空间一致性和形状平滑性.此外,为优化内存使用,本方法引入了稀疏结构降低高分辨率体素的内存开销,并设计了两个正则化项进一步提升重建结果的平滑度.所提出的体素编码模块具有即插即用的特性,可无缝集成到各类隐式表面重建方法中.实验结果表明,该方法在DTU、EPFL和BlendedMVS等基准数据集上的多项评估指标均实现了显著提升,能够生成兼具平滑性和细节丰富性的高质量重建结果. 展开更多
关键词 立体和多视图处理 神经隐式表面重建 层次化体素编码
在线阅读 下载PDF
卫星三维数据在林权确权调查工作的应用
16
作者 杨昌 吴丕团 孙时钟 《测绘技术装备》 2025年第2期138-142,共5页
针对林权确权调查工作中存在的历史遗留问题,本文提出了一种三维权籍调查方法。该方法利用卫星三维数据来构建全域地形级实景三维大场景模型,结合调查全流程业务开发三维权籍调查软件,进而开展林权确权调查,并在广西壮族自治区某县进行... 针对林权确权调查工作中存在的历史遗留问题,本文提出了一种三维权籍调查方法。该方法利用卫星三维数据来构建全域地形级实景三维大场景模型,结合调查全流程业务开发三维权籍调查软件,进而开展林权确权调查,并在广西壮族自治区某县进行试点应用,验证所提议方法的可行性,旨在探索一条基于卫星三维数据的林权确权调查技术路径,实现低成本与高效率的林权确权调查双重目标。 展开更多
关键词 三视立体卫星 实景三维 林权确权调查 三维权籍调查
在线阅读 下载PDF
注意力机制与神经渲染的多视图三维重建算法 被引量:2
17
作者 朱代先 孔浩然 +2 位作者 秋强 刘树林 张亚莉 《电子测量技术》 北大核心 2024年第5期158-166,共9页
针对多视图立体网络在弱纹理或非朗伯曲面等挑战性区域重建效果差的问题,首先提出一个基于3个并行扩展卷积和注意力机制的多尺度特征提取模块,在增加感受野的同时捕获特征之间的依赖关系以获取全局上下文信息,从而提升多视图立体网络在... 针对多视图立体网络在弱纹理或非朗伯曲面等挑战性区域重建效果差的问题,首先提出一个基于3个并行扩展卷积和注意力机制的多尺度特征提取模块,在增加感受野的同时捕获特征之间的依赖关系以获取全局上下文信息,从而提升多视图立体网络在挑战性区域特征的表征能力以进行鲁棒的特征匹配。其次在代价体正则化3D CNN部分引入注意力机制,使网络注意于代价体中的重要区域以进行平滑处理。另外建立一个神经渲染网络,该网络利用渲染参考损失精确地解析辐射场景表达的几何外观信息,并引入深度一致性损失保持多视图立体网络与神经渲染网络之间的几何一致性,有效地缓解有噪声代价体对多视图立体网络的不利影响。该算法在室内DTU数据集中测试,点云重建的完整性和整体性指标分别为0.289和0.326,与基准方法CasMVSNet相比,分别提升24.9%和8.2%,即使在挑战性区域也得到高质量的重建效果;在室外Tanks and Temples中级数据集中,点云重建的平均F-score为60.31,与方法UCS-Net相比提升9.9%,体现出较强的泛化能力。 展开更多
关键词 多视图立体网络 三维重建 注意力机制 神经渲染
原文传递
基于注意力机制的多视图立体重建算法 被引量:1
18
作者 朱代先 巩若琳 +1 位作者 孔浩然 刘树林 《电子测量技术》 北大核心 2024年第16期130-138,共9页
针对多视图立体重建在光照不均匀、弱纹理、非朗伯表面等复杂场景中重建完整度差、泛化能力不足的问题,本文提出了一种基于注意力机制的多视图立体重建算法。在特征提取阶段,该算法采用基于深度可分离卷积和自注意力机制的多尺度特征提... 针对多视图立体重建在光照不均匀、弱纹理、非朗伯表面等复杂场景中重建完整度差、泛化能力不足的问题,本文提出了一种基于注意力机制的多视图立体重建算法。在特征提取阶段,该算法采用基于深度可分离卷积和自注意力机制的多尺度特征提取模块,在扩大感受野的同时增强多视图间的空间特征关系,从而提升网络在复杂场景下特征的表征能力以实现更精确的特征匹配。在代价体正则化阶段,本文引入通道注意力机制来自适应调节不同通道的权重,从而减少无关信息对模型的干扰并过滤背景噪声,以提升模型的泛化能力。在DTU数据集上,本文算法的完整度和整体度分别为0.286和0.334,与基准算法CasMVSNet相比,分别提升了25.71%和5.92%,与其他的state-of-the-art(SOTA)算法相比,在复杂场景中重建点云的结构也更加完整。在Tanks and Temples中级数据集上,重建点云综合指标F-score为61.49,这表明本文算法具有更好的鲁棒性和泛化能力。 展开更多
关键词 三维重建 多视图立体 注意力机制
原文传递
利用多帧序列影像的自监督单目深度估计 被引量:1
19
作者 熊炜 陈奕博 +2 位作者 张丽真 杨茜 邹勤 《计算机应用》 CSCD 北大核心 2024年第12期3907-3914,共8页
多帧自监督单目深度估计通过当前帧和上一帧之间的关系构建代价体积(CV),可以作为单目深度估计网络的额外输入源,更准确地描述场景视频中的时间序列关系和空间结构信息;然而,当场景中存在动态物体或者无纹理区域时,CV会成为不可靠的信... 多帧自监督单目深度估计通过当前帧和上一帧之间的关系构建代价体积(CV),可以作为单目深度估计网络的额外输入源,更准确地描述场景视频中的时间序列关系和空间结构信息;然而,当场景中存在动态物体或者无纹理区域时,CV会成为不可靠的信息来源。当单目深度估计网络过度依赖CV中的不可靠信息源时,会导致深度估计精度下降。为此,设计一种多帧融合模块动态降低不可靠信息源的权重,减小不可靠信息源对网络的影响。为了应对CV中不可靠信息源对网络训练的负面影响,还设计了一种引导深度估计网络训练的网络,防止深度估计网络过度依赖不可靠信息。所提方法在KITTI数据集上取得了出色的性能,与基准方法 Lite-Mono相比,它的绝对相对误差、平方相对误差和均方根误差(RMSE)分别下降了0.015、0.094和0.200;与同类方法相比,所提方法精度更高,且占用的计算资源更少。所提网络结构充分利用了多帧训练的优势,同时避免了多帧训练的缺陷(即CV不确定性对网络的影响),可有效提升模型精度。 展开更多
关键词 自监督单目深度估计 多视图立体 单目视频 代价体积
在线阅读 下载PDF
基于自适应聚合循环递归的稠密点云重建网络 被引量:1
20
作者 王江安 黄乐 +2 位作者 庞大为 秦林珍 梁温茜 《图学学报》 CSCD 北大核心 2024年第1期230-239,共10页
为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络,即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多... 为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络,即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多尺度循环递归残差的特征提取模块,聚合上下文语义信息,以解决弱纹理或无纹理区域特征提取难的问题。在代价体正则化部分,提出一种残差正则化模块,该模块在略微增加内存消耗的前提下,提高了3D CNN提取和聚合上下文语意的能力。实验结果表明,提出的方法在DTU数据集上的综合指标排名靠前,在重建细节上有着更好的体现,且在BlendedMVS数据集上生成了不错的深度图和点云结果,此外网络还在自采集的大规模高分辨率数据集上进行了泛化测试。归功于由粗到细的多阶段思想和我们提出的模块,网络在生成高准确性和完整性深度图的同时,还能进行高分辨率重建以适用于实际问题。 展开更多
关键词 深度学习 计算机视觉 三维重建 稠密重建 多视图立体 递归神经网络
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部