期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于NeRF和改进RandLA-Net的果树三维重建与果实语义分割方法
1
作者 杨达成 郭俊 +2 位作者 杨景 张亚莉 兰玉彬 《华南农业大学学报》 北大核心 2025年第4期528-537,共10页
【目的】解决复杂果园环境下的果实精准分割问题。【方法】本文提出一种新颖的柑橘果树三维重建与果实语义分割方法。首先,利用神经辐射场(Neural radiance field,NeRF)技术从多视角图像中学习果树的隐式三维表示,生成高质量的果树点云... 【目的】解决复杂果园环境下的果实精准分割问题。【方法】本文提出一种新颖的柑橘果树三维重建与果实语义分割方法。首先,利用神经辐射场(Neural radiance field,NeRF)技术从多视角图像中学习果树的隐式三维表示,生成高质量的果树点云模型;然后,采用改进后的随机局部点云特征聚合网络(Random local point cloud feature aggregation network,RandLA-Net)对果树点云进行端到端的语义分割,准确提取出果实点云。对RandLA-Net进行针对性改进,在编码器层后增加双边增强模块,采用更适合果实点云分割任务的损失函数,并通过柑橘果树数据集对改进后的分割网络进行验证试验。【结果】所提出的方法能够有效地重建果树三维结构,改进后网络的平均交并比提高了2.64个百分点,果实的交并比提高了7.33个百分点,验证了该方法在智慧果园场景下的实用性。【结论】研究为实现果园智能化管理和自动化采摘提供了新的技术支撑。 展开更多
关键词 果树重建 果实分割 神经辐射场 点云语义分割 智慧农业
在线阅读 下载PDF
基于NeRF的SLAM研究综述
2
作者 喻伟东 鲁静 程晗蕾 《计算机系统应用》 2025年第4期18-33,共16页
随着神经辐射场(NeRF)的提出,其基于神经隐式表示场景的方法在生成高保真地图方面具有显著优势,将NeRF应用于同时定位与地图构建(SLAM)中,即基于NeRF的SLAM方法,能够在实现高精度的定位的同时进行连续的3D建模,通过渲染新视角并预测未... 随着神经辐射场(NeRF)的提出,其基于神经隐式表示场景的方法在生成高保真地图方面具有显著优势,将NeRF应用于同时定位与地图构建(SLAM)中,即基于NeRF的SLAM方法,能够在实现高精度的定位的同时进行连续的3D建模,通过渲染新视角并预测未知区域,提高场景重建的质量和细节.为了跟踪该领域的最新研究成果,对近年来基于NeRF的SLAM的关键算法进行了回顾和综述.首先介绍了NeRF技术的核心原理并全面概述了基于NeRF的SLAM方法的框架,其次重点探讨了基于NeRF的SLAM的改进和优化,包括提高神经隐式表征效率、解决大尺度场景建图问题、增加回环和全局优化实现全局一致性和解决动态干扰问题,最后对基于NeRF的SLAM方法进行了展望,为相关研究人员提供有价值的参考,以促进更多创新研究. 展开更多
关键词 同时定位与地图构建 神经辐射场 神经隐式表示 三维重建 移动机器人
在线阅读 下载PDF
Decoupled two-stage talking head generation via Gaussian-landmark-based neural radiance fields
3
作者 Boyao Ma Yuanping Cao Lei Zhang 《Computational Visual Media》 2025年第4期799-816,共18页
Talking head generation based on neural radiance fields(NeRF)has gained prominence,primarily owing to its implicit 3D representation capability within neural networks.However,most NeRF-based methods often intertwine a... Talking head generation based on neural radiance fields(NeRF)has gained prominence,primarily owing to its implicit 3D representation capability within neural networks.However,most NeRF-based methods often intertwine audio-to-video conversion in a joint training process,resulting in challenges such as inadequate lip synchronization,limited learning efficiency,large memory requirement,and lack of editability.In response to these issues,this paper introduces a fully decoupled NeRF-based method for generating talking heads.This method separates audio-to-video conversion into two stages through the use of facial landmarks.Notably,the Transformer network is used to effectively establish the cross-modal connection between audio and landmarks and to generate landmarks conforming to the distribution of training data.We also explore formant features of the audio as additional conditions to guide landmark generation.Then,these landmarks are combined with Gaussian relative position coding to refine the sampling points on the rays,thereby constructing a dynamic NeRF conditioned on these landmarks and audio features for rendering the generated head.This decoupled setup enhances both the fidelity and flexibility of mapping audio to video with two independent small-scale networks.Additionally,it supports the generation of the torso from the head-only image with improved StyleUnet,further enhancing the realism of the generated talking head.Our experimental results demonstrate that our method excels in producing lifelike talking heads,and that the lightweight neural network models also exhibit superior speed and learning efficiency with lower memory requirements. 展开更多
关键词 audio-driven generation talking head Transformer neural radiance fields(nerf)rendering
原文传递
基于结构化潜码引导NeRF的语音驱动人脸重演 被引量:1
4
作者 谢志峰 郑迦恒 +2 位作者 王吉 梁佳佳 马利庄 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第10期1616-1624,共9页
语音驱动的人脸重演的目标是生成与输入语音内容相匹配的高保真人脸面部动画.然而,由于音频与视频模态之间存在鸿沟,当前方法难以实现高质量的面部重演.针对现有方法保真度低、唇音同步效果差等问题,提出一种基于结构化潜码引导隐式神... 语音驱动的人脸重演的目标是生成与输入语音内容相匹配的高保真人脸面部动画.然而,由于音频与视频模态之间存在鸿沟,当前方法难以实现高质量的面部重演.针对现有方法保真度低、唇音同步效果差等问题,提出一种基于结构化潜码引导隐式神经表示的语音驱动人脸重演方法,以人脸点云序列作为中间表示,将语音驱动人脸重演分解为跨模态映射和神经辐射场渲染两大任务分别解决.首先,通过跨模态映射从音频预测人脸表情系数,利用人脸三维重建技术获得人脸身份系数;然后,基于3DMM模型合成人脸点云动画序列;接着,使用顶点位置信息构建结构化隐式神经表示,回归场景中每个采样点的密度和颜色值;最后,通过体绘制技术渲染人脸RGB帧,并装配到原图像中.在多个时长为3~5 min的单人演讲视频上的可视化比较、量化评估、主观评估等实验结果表明,文中所提方法在唇音同步效果与图像生成精度上优于AD-NeRF等方法,能够实现高保真语音驱动人脸重演. 展开更多
关键词 音频驱动人脸重演 隐式神经表示 神经辐射场 跨模态
在线阅读 下载PDF
SG-NeRF:Sparse-Input Generalized Neural Radiance Fields for Novel View Synthesis
5
作者 Kuo Xu Jie Li +1 位作者 Zhen-Qiang Li Yang-Jie Cao 《Journal of Computer Science & Technology》 SCIE EI CSCD 2024年第4期785-797,共13页
Traditional neural radiance fields for rendering novel views require intensive input images and pre-scene optimization,which limits their practical applications.We propose a generalization method to infer scenes from ... Traditional neural radiance fields for rendering novel views require intensive input images and pre-scene optimization,which limits their practical applications.We propose a generalization method to infer scenes from input images and perform high-quality rendering without pre-scene optimization named SG-NeRF(Sparse-Input Generalized Neural Radiance Fields).Firstly,we construct an improved multi-view stereo structure based on the convolutional attention and multi-level fusion mechanism to obtain the geometric features and appearance features of the scene from the sparse input images,and then these features are aggregated by multi-head attention as the input of the neural radiance fields.This strategy of utilizing neural radiance fields to decode scene features instead of mapping positions and orientations enables our method to perform cross-scene training as well as inference,thus enabling neural radiance fields to generalize for novel view synthesis on unseen scenes.We tested the generalization ability on DTU dataset,and our PSNR(peak signal-to-noise ratio)improved by 3.14 compared with the baseline method under the same input conditions.In addition,if the scene has dense input views available,the average PSNR can be improved by 1.04 through further refinement training in a short time,and a higher quality rendering effect can be obtained. 展开更多
关键词 neural radiance fields(nerf) multi-view stereo(MVS) new view synthesis(NVS)
原文传递
基于改进NeRF的大规模不可移动文物三维重建方法研究
6
作者 赖志卿 连明昌 陈松航 《自动化与仪器仪表》 2024年第11期6-10,共5页
神经辐射场(NeRF)在文物三维重建保护方面具有重要的应用前景,但针对大规模的不可移动文物三维重建,已有的NeRF技术面临计算资源消耗大、模型无法局部修复的挑战。为此,本研究提出采用八叉树对NeRF的体素采样步骤进行场景分区改进,实现N... 神经辐射场(NeRF)在文物三维重建保护方面具有重要的应用前景,但针对大规模的不可移动文物三维重建,已有的NeRF技术面临计算资源消耗大、模型无法局部修复的挑战。为此,本研究提出采用八叉树对NeRF的体素采样步骤进行场景分区改进,实现NeRF并行轻量化三维重建,并使其模型支持局部针对性修复,极大提高了NeRF技术在大规模不可移动文物三维重建领域的实用性。 展开更多
关键词 文物保护 三维重建 神经辐射场 八叉树
原文传递
融合局部空间信息的新视角合成方法
7
作者 贾迪 刘洋 +4 位作者 李维 韩雪峰 宋慧伦 孟晓华 刘宇琪 《中国图象图形学报》 北大核心 2025年第10期3346-3360,共15页
目的 基于点云的神经渲染方法受点云质量及特征提取的影响,易导致新视角合成图像渲染质量下降,为此提出一种融合局部空间信息的新视角合成方法。方法 针对点云质量及提取特征不足的问题,首先,设计一种神经点云特征对齐模块,将点云与图... 目的 基于点云的神经渲染方法受点云质量及特征提取的影响,易导致新视角合成图像渲染质量下降,为此提出一种融合局部空间信息的新视角合成方法。方法 针对点云质量及提取特征不足的问题,首先,设计一种神经点云特征对齐模块,将点云与图像匹配区域的特征进行对齐,融合后构成神经点云,提升其特征的局部表达能力;其次,提出一种神经点云Transformer模块,用于融合局部神经点云的上下文信息,在点云质量不佳的情况下仍能提取可靠的局部空间信息,有效增强了点云神经渲染方法的合成质量。结果 实验结果表明,在真实场景数据集中,对于只包含单一物品的数据集Tanks and Temples,本文方法在峰值信噪比(peak signal to noise ratio,PSNR)指标上与NeRF(neural radiance field)方法相比提升19.2%,相较于使用点云输入的方法 Tetra-NeRF和Point-NeRF分别提升了6.4%和3.8%,即使在场景更为复杂的ScanNet数据集中,与NeRF方法及Point-NeRF相比分别提升了34.6%和2.1%。结论 本文方法能够更好地利用点云的局部空间信息,有效改善了稀疏视角图像输入下因点云质量和提取特征导致的渲染质量下降,实验结果验证了本文方法的有效性。 展开更多
关键词 神经辐射场(nerf) 点云 神经渲染 三维重建 体积密度
原文传递
SLAM新机遇—高斯溅射技术 被引量:1
8
作者 谭臻 牛中颜 +2 位作者 张津浦 陈谢沅澧 胡德文 《中国图象图形学报》 北大核心 2025年第6期1792-1807,共16页
同步定位与建图(simultaneous localization and mapping,SLAM)是指在未知环境中同时实现自主移动机器人的定位和环境地图构建,其在机器人技术和自动驾驶等领域有着重要价值。本文首先回顾SLAM技术的发展历程,从早期的手工特征提取方法... 同步定位与建图(simultaneous localization and mapping,SLAM)是指在未知环境中同时实现自主移动机器人的定位和环境地图构建,其在机器人技术和自动驾驶等领域有着重要价值。本文首先回顾SLAM技术的发展历程,从早期的手工特征提取方法到现代的深度学习驱动的解决方案。其中,基于神经辐射场(neural radiance fields,NeRF)的SLAM方法利用神经网络进行场景表征,进一步提高了建图的可视化效果。然而,这类方法在渲染速度上仍然面临挑战,限制了其实时应用的可能性。相比之下,基于高斯溅射(Gaussian splatting,GS)的SLAM方法以其实时的渲染速度和照片级的场景渲染效果,为SLAM领域带来新的研究热点和机遇。接着,按照RGB/RGBD、多模态数据以及语义信息3种不同应用类型对基于高斯溅射的SLAM方法进行分类和总结,并针对每种情况讨论相应SLAM方法的优势和局限性。最后,针对当前基于高斯溅射的SLAM方法面临的实时性、基准一致化、大场景的扩展性以及灾难性遗忘等问题进行分析,并对未来研究方向进行展望。通过这些探讨和分析,旨在为SLAM领域的研究人员和工程师提供全面的视角和启发,帮助分析和理解当前SLAM系统面临的关键问题,推动该领域的技术进步和应用拓展。 展开更多
关键词 同步定位与建图(SLAM) 神经辐射场(nerf) 高斯溅射(GS) RGB-(D) 多模态 语义信息
原文传递
Manhattan结构约束神经辐射场在城市遥感图像中的三维重建
9
作者 黄洋 郭宇 +2 位作者 路遥 姜鹏 王飞 《中国图象图形学报》 北大核心 2025年第7期2584-2596,共13页
目的利用卫星遥感影像对地球表面进行三维重建是计算机视觉和遥感领域的研究热点。一些大尺度的三维重建方法都期望在城市地区能有更好的效果。为了使复杂结构渲染更加精细、人造建筑的平面更加平整、训练速度更快,提出一种快速高精度... 目的利用卫星遥感影像对地球表面进行三维重建是计算机视觉和遥感领域的研究热点。一些大尺度的三维重建方法都期望在城市地区能有更好的效果。为了使复杂结构渲染更加精细、人造建筑的平面更加平整、训练速度更快,提出一种快速高精度的城市地区遥感神经辐射场(neural radiance field,NeRF)三维重建算法。方法根据城市地区相对于其他自然场景呈现的结构性规律,即城市建筑物通常具有较强的几何特征和规整性,采用Manhattan坐标系的几何结构约束三维重建过程,从而确保重建结果的几何准确性和细节保真度。此外,多分辨率哈希编码模块通过引入哈希表和可学习的位置编码减少原始神经辐射场的多层神经网络,显著减少了辐射场的训练时间。结果实验使用DFC2019(data fusion contest)数据集测试,与当前先进算法进行测试对比。实验结果表明,本文提出的方法在城市建筑物地区图像上具有高效训练速度的同时取得了更好的渲染质量与高程信息,有效地实现了复杂建筑群的重建。与现有方法相比,在图像质量与高程重建误差等指标上均有明显提升。结论该方法在提高城市复杂建筑群三维重建精度和训练效率方面表现更加优秀,为城市遥感影像三维重建提供了一种有效的解决方案。 展开更多
关键词 遥感影像 三维重建 神经辐射场(nerf) 曼哈顿框架(MF) 哈希编码
原文传递
稀疏视角下基于几何一致性的神经辐射场卫星城市场景渲染与数字表面模型生成
10
作者 孙文博 高智 +3 位作者 张依晨 朱军 李衍璋 路遥 《电子与信息学报》 北大核心 2025年第6期1679-1689,共11页
卫星遥感提供了全球、连续、多尺度的地表观测能力。近年来,神经辐射场(NeRF)因其连续渲染和隐式重建特性,在自动驾驶与大场景重建等领域表现出良好鲁棒性,受到广泛关注。然而,NeRF在卫星对地观测中的应用效果有限,主要因其训练需大量... 卫星遥感提供了全球、连续、多尺度的地表观测能力。近年来,神经辐射场(NeRF)因其连续渲染和隐式重建特性,在自动驾驶与大场景重建等领域表现出良好鲁棒性,受到广泛关注。然而,NeRF在卫星对地观测中的应用效果有限,主要因其训练需大量多视角图像,而卫星影像获取受限。在视角稀疏时,模型易对训练视角过拟合,导致新视角下性能下降。针对上述问题,该文提出一种新的方法,通过在NeRF的训练过程中引入场景深度与表面法线的几何约束,旨在提升在稀疏视角条件下的渲染与数字表面模型(DSM)生成能力。通过在DFC2019数据集上进行广泛实验,验证了所提出方法的有效性。实验结果表明,采用几何约束的NeRF模型在稀疏视角条件下的新视角合成和DSM生成任务上均取得了领先的结果,显示出其在稀疏视角条件下卫星观测场景中的应用潜力。 展开更多
关键词 卫星对地观测 神经辐射场 场景渲染 数字表面模型
在线阅读 下载PDF
以神经辐射场和三维高斯泼溅为基础的文本指导三维编辑综述 被引量:2
11
作者 卢丽华 张晓辉 +3 位作者 魏辉 李茹杨 杜国光 王斌强 《中国图象图形学报》 北大核心 2025年第5期1238-1256,共19页
文本引导的三维编辑可以根据目标文本的引导,改变现有三维资产的几何形状和外观,从而创建多样化和高质量的三维资产。先进三维神经表示、文本引导图像生成与编辑等一系列关键技术的出现和发展,推动了文本引导三维编辑的进步。本文主要... 文本引导的三维编辑可以根据目标文本的引导,改变现有三维资产的几何形状和外观,从而创建多样化和高质量的三维资产。先进三维神经表示、文本引导图像生成与编辑等一系列关键技术的出现和发展,推动了文本引导三维编辑的进步。本文主要聚焦于基于神经辐射场和三维高斯泼溅的文本指导三维编辑的最新进展,并从方法本质与编辑能力两个维度对现有研究进行梳理与总结。具体地,本文将现有研究按照编辑约束,分为无约束、隐式约束和显式约束3个类别,以深入剖析各方法本质。此外,本文还从编辑类型(如几何、外观)、编辑范围(如物体、场景)、编辑鲁棒性(如全局或局部可控性)等多个方面,对现有研究的编辑能力进行了探讨。最后,本文分析了当前研究所面临的挑战,并展望了未来潜在的研究方向。 展开更多
关键词 文本指导 三维编辑 神经辐射场(nerf) 三维高斯泼溅(3GS) 编辑约束 三维编辑能力
原文传递
神经辐射场恢复水下图像失真
12
作者 华喜锋 黄志勇 +1 位作者 杨晨龙 姚玉 《计算机工程与应用》 北大核心 2025年第9期296-303,共8页
神经辐射场(neural radiance fields,NeRF)是一个备受关注的新兴研究领域,旨在解决新视角合成问题。然而,将其应用于水下环境时存在诸多挑战,如淹没在波形水面下的静态场景图像时常呈现严重的非刚性失真,这主要是由于水面波动和折射导... 神经辐射场(neural radiance fields,NeRF)是一个备受关注的新兴研究领域,旨在解决新视角合成问题。然而,将其应用于水下环境时存在诸多挑战,如淹没在波形水面下的静态场景图像时常呈现严重的非刚性失真,这主要是由于水面波动和折射导致的视觉扭曲。为了解决水下物体图像失真问题,深入分析波形水面的光学特性以及水下物体表面的失真情况,提出了一种针对水下场景的NeRF框架。自制了一种数据采集装置,将相机固定在水面上方,根据水流在时间和空间具有周期性的物理特性,仿真出多视角的虚拟相机,有效解决了水下数据采集难题。利用图像光流恢复水面波形。基于斯涅尔定律校正采样策略,通过重定义光线追踪过程中的起点和方向,渲染出校正后的水下图像。利用真实水下场景数据集对该方法进行了定性和定量的评估,结果表明该方法能够有效消除水下图像失真,且该方法在水下图像三维重建方面的表现优于现有的算法,为水下新视角图像合成提供了新的思路和方法。 展开更多
关键词 神经辐射场 水下物体 光流法 斯涅尔定律
在线阅读 下载PDF
面向动态三维人体重建的神经辐射场加速方法
13
作者 肖祎龙 邓伊琴 陈志刚 《计算机工程》 北大核心 2025年第8期95-106,共12页
针对动态三维人体重建场景下神经辐射场训练效率低和体渲染计算复杂度高的问题,提出一种神经辐射场(NeRF)加速方法。引入多分辨率哈希编码作为位置特征编码,提高神经辐射场的局部细节特征表示能力,加快模型收敛;设计体密度估计网络,添... 针对动态三维人体重建场景下神经辐射场训练效率低和体渲染计算复杂度高的问题,提出一种神经辐射场(NeRF)加速方法。引入多分辨率哈希编码作为位置特征编码,提高神经辐射场的局部细节特征表示能力,加快模型收敛;设计体密度估计网络,添加不透明度损失函数,结合PP-Matting方法输出的人体透明度图优化体密度估计网络,通过估计体渲染过程中相机射线上透射率分布,结合逆变换采样实现体渲染重要性采样,减少无效采样点,提高体渲染计算效率;通过二值化透明度图获得高精度人体前景掩码,提高人体重建数据集质量。实验结果表明,引入多分辨率哈希编码和体渲染重要性采样策略后,该方法在ZJU-MoCap和SHTU-MoCap数据集上重建速度相较Neural Body、HumanNeRF和MonoHuman等人体重建方法提高17.7%、9.5%和37.5%,且重建精度更高,通过PP-Matting方法配合二值化操作将人体掩码提取精度提升至96%以上。 展开更多
关键词 三维人体重建 神经辐射场 体渲染加速 人体掩码提取 位置特征编码
在线阅读 下载PDF
基于SLAM与神经辐射场的柑橘幼苗三维重建方法
14
作者 郭俊 杨达成 +2 位作者 莫振杰 兰玉彬 张亚莉 《华南农业大学学报》 北大核心 2025年第3期429-438,共10页
【目的】针对现有三维重建技术难以获取柑橘幼苗精细三维点云及其三维表型参数来表征幼苗状态的问题,提出一种基于同时定位与地图构建算法(Simultaneous localization and mapping,SLAM)与神经辐射场(Neural radiance fields,NeRF)的柑... 【目的】针对现有三维重建技术难以获取柑橘幼苗精细三维点云及其三维表型参数来表征幼苗状态的问题,提出一种基于同时定位与地图构建算法(Simultaneous localization and mapping,SLAM)与神经辐射场(Neural radiance fields,NeRF)的柑橘幼苗三维重建方法。【方法】以1年期的柑橘幼苗为研究对象,首先,利用深度传感器获取柑橘幼苗的RGB和深度图;其次,使用SLAM计算深度传感器在每一帧图像的位姿;然后训练幼苗NeRF网络,将附有位姿的多视角图像输入多层感知机(Multilayer erceptron,MLP);最后,通过体积渲染监督训练,重建高精细的三维实景点云模型。【结果】本文方法重建的柑橘幼苗三维模型,在色彩与纹理方面极具真实性,模型轮廓清晰、层次分明,具有实景级的精度。该模型可有效提取柑橘幼苗的三维表型参数,株高、宽幅长、宽幅宽和胸径的准确率分别为97.94%、93.95%、94.11%和97.62%。【结论】研究有助于加快优良柑橘幼苗的选育进程,可为柑橘产业的可持续性发展提供技术支持。 展开更多
关键词 柑橘幼苗 植物三维表型 三维重建 神经辐射场 SLAM 深度学习
在线阅读 下载PDF
RefN-SLAM:反射场景下的神经SLAM方法
15
作者 胡佳豪 尚伟伟 +1 位作者 汤新胜 张飞 《机器人》 北大核心 2025年第5期708-717,共10页
传统的同步定位与地图构建(SLAM)方法依赖光度一致性假设,往往无法处理光照复杂变化的场景。为此,提出了一种基于神经辐射场的反射场景映射方法RefN-SLAM。具体来说,使用2个神经辐射场对场景的高光和低光部分分别建模,并通过与固定色调... 传统的同步定位与地图构建(SLAM)方法依赖光度一致性假设,往往无法处理光照复杂变化的场景。为此,提出了一种基于神经辐射场的反射场景映射方法RefN-SLAM。具体来说,使用2个神经辐射场对场景的高光和低光部分分别建模,并通过与固定色调映射系数加权相加,得到最终场景的颜色表示。与此同时,结合表面感知采样和透视感知采样,进一步增强了场景的深度感知,并通过由粗到精的优化提升了重建精度和计算效率。最终,在全局关键帧像素数据库上对场景表示和相机位姿进行了联合优化。实验结果表明,RefN-SLAM方法在化学实验室场景下取得了良好的重建结果,并在合成数据集和真实世界机器人实验中都具有出色的跟踪性能。 展开更多
关键词 视觉SLAM(同步定位与地图构建) 神经辐射场 室内反射场景 复杂光照变化
原文传递
融合语义分布与神经辐射场的无人机图像三维表面重建方法
16
作者 李力 张永生 +3 位作者 江志鹏 王自全 高寒 于英 《测绘科学技术学报》 2025年第4期372-380,共9页
为解决现有三维重建方法中几何信息与辐射信息耦合程度不足,导致重建结果受动态物体和阴影影响较大的问题,提出了一种融合语义分布与神经辐射场的无人机图像三维表面重建方法。通过类别信息嵌入,将语义分布融入神经辐射场模型中,与辐射... 为解决现有三维重建方法中几何信息与辐射信息耦合程度不足,导致重建结果受动态物体和阴影影响较大的问题,提出了一种融合语义分布与神经辐射场的无人机图像三维表面重建方法。通过类别信息嵌入,将语义分布融入神经辐射场模型中,与辐射信息共同接受优化,完成语义与成像特性恢复的良性互动,实现了面向高保真三维重建和物方属性信息提取的几何-语义一体化处理。实验结果表明,融合语义分布后的神经辐射场模型,光线状态重建效果更加合理,在新视角渲染、地物属性探测与DSM重建任务中,其性能均得到了有效提升,在提高三维表面重建的同时能够更好地辅助下游任务(如动态物体检测、阴影识别)等。 展开更多
关键词 无人机图像 神经辐射场 语义分割 上下文信息 三维表面重建
在线阅读 下载PDF
利用本征属性分类的神经辐射场视角及语义一致性重建
17
作者 曾志鸿 王宗继 +4 位作者 张源奔 蔡伟南 张利利 郭岩 刘俊义 《中国图象图形学报》 北大核心 2025年第2期559-574,共16页
目的基于神经辐射场(neural radiance field,NeRF)的3D场景重建与新视角生成工作正受到研究者的广泛重视,然而现有的神经辐射场方法通常对给定的场景进行高度专门化的表征,且将场景的几何与外观表征为“混合场”,这对场景的几何与外观... 目的基于神经辐射场(neural radiance field,NeRF)的3D场景重建与新视角生成工作正受到研究者的广泛重视,然而现有的神经辐射场方法通常对给定的场景进行高度专门化的表征,且将场景的几何与外观表征为“混合场”,这对场景的几何与外观编辑、场景泛化和3D资源的使用造成了不便。方法提出了一个学习对象本征属性的神经辐射场分类网络,通过图像增强的方式去除高光和阴影,并使用分类的方式实现颜色分解,即从现实场景中提取室内场景语义级目标的本征属性,在此基础上进行神经辐射场的重建。提出了前点优胜模块与颜色分类模块。前点优胜模块在体渲染阶段优化射线代表的本征属性,从而提升神经辐射场的语义一致性;颜色分类模块在辐射场重建阶段,通过全连接网络进行本征属性的分类优化,提高辐射场的语义及视角间一致性。两个主要模块共同作用,使重建的辐射场具备良好的针对外观的泛化能力,可支持场景重上色、重光照以及针对阴影与高光的编辑等任务。结果相比于现有的基于神经辐射场的学习进行本征分解的Intrinsic NeRF方法,在Replica数据集中的充分实验表明,在有限的GPU显存和运行时间下,重建的本征属性神经辐射场具备语义及视角间一致性。针对提升语义一致性的前点优胜模块,本文方法在基线模型Semantic NeRF的基础上提高了4.1%,在未加入该模块的基础上提高了3.9%。针对提升本征分解语义及视角间一致性的颜色分类模块,本文方法在Intrinsic NeRF的本征分解工作基础上提升了10.2%,在未加入颜色分类层的基础上提升了1.7%。结论本文方法构建的本征属性神经辐射场具备语义及视角间一致性,可描述复杂场景几何关系且具备良好外观泛化性。在场景重上色、重光照、阴影与高光的编辑等任务中取得了视角间一致的逼真效果。 展开更多
关键词 图像处理 场景重建 神经辐射场(nerf) 本征分解 场景编辑
原文传递
基于Transformer的点云神经辐射场三维重建方法
18
作者 梁涛 赵志浩 +3 位作者 杨岸然 贾庆仁 谢孟晨 袁丽红 《现代电子技术》 北大核心 2025年第19期150-157,共8页
针对点云神经辐射场在重建纹理复杂场景时容易产生伪影、边缘缺陷或者过度模糊的问题,文中提出一种基于Transformer的点云神经辐射场三维重建方法。引入Transformer架构对特征图进行位置编码,赋予网络全局感受野,聚合多视图上下文信息,... 针对点云神经辐射场在重建纹理复杂场景时容易产生伪影、边缘缺陷或者过度模糊的问题,文中提出一种基于Transformer的点云神经辐射场三维重建方法。引入Transformer架构对特征图进行位置编码,赋予网络全局感受野,聚合多视图上下文信息,得到高精度的神经点云位置坐标和置信度,减少重建场景中空洞缺陷部分的出现;设计神经点云特征生成网络,添加自注意力机制,增强神经点云的特征表达能力;通过体渲染网络聚合场景表面相邻神经点后,得到更准确的采样点辐射亮度和体密度,提高重建视图的清晰度,降低伪影效果。实验结果表明,基于Transformer的点云神经辐射场在NeRF Synthetic数据集上,峰值信噪比、结构相似度、学习感知图像块相似度的平均值相较于原始点云神经辐射场分别提升了2.37%、0.83%、10.2%,重建视图的细节特征更加丰富,视觉效果良好。 展开更多
关键词 点云神经辐射场 TRANSFORMER 神经点云 三维重建 自注意力 nerf Synthetic
在线阅读 下载PDF
Evaluating Neural Radiance Fields for 3D Plant Geometry Reconstruction in Field Conditions 被引量:1
19
作者 Muhammad Arbab Arshad Talukder Jubery +5 位作者 James Afful Anushrut Jignasu Aditya Balu Baskar Ganapathysubramanian Soumik Sarkar Adarsh Krishnamurthy 《Plant Phenomics》 CSCD 2024年第4期978-994,共17页
We evaluate different Neural Radiance Field(NeRF)techniques for the 3D reconstruction of plants in varied environments,from indoor settings to outdoor fields.Traditional methods usually fail to capture the complex geo... We evaluate different Neural Radiance Field(NeRF)techniques for the 3D reconstruction of plants in varied environments,from indoor settings to outdoor fields.Traditional methods usually fail to capture the complex geometric details of plants,which is crucial for phenotyping and breeding studies.We evaluate the reconstruction fidelity of NeRFs in 3 scenarios with increasing complexity and compare the results with the point cloud obtained using light detection and ranging as ground truth.In the most realistic field scenario,the NeRF models achieve a 74.6%F1 score after 30 min of training on the graphics processing unit,highlighting the efficacy of NeRFs for 3D reconstruction in challenging environments.Additionally,we propose an early stopping technique for NeRF training that almost halves the training time while achieving only a reduction of 7.4%in the average F1 score.This optimization process substantially enhances the speed and efficiency of 3D reconstruction using NeRFs.Our findings demonstrate the potential of NeRFs in detailed and realistic 3D plant reconstruction and suggest practical approaches for enhancing the speed and efficiency of NeRFs in the 3D reconstruction process. 展开更多
关键词 field conditions breeding studies D plant geometry reconstruction PHENOTYPING light detection point cloud neural radiance fields neural radiance field nerf techniques
原文传递
基于NeRF的文物建筑数字化重建 被引量:15
20
作者 程斌 杨勇 +3 位作者 徐崇斌 李国帅 任镤 高致 《航天返回与遥感》 CSCD 北大核心 2023年第1期40-49,共10页
文物古迹建筑在历史的发展中不断丢失其本身的特征,在时间的推移中不断改变或消失。因此,如何精确的测量保存当前文物的历史风貌是一个亟需解决的问题。数字化建模可以最大程度地保存文物在当前时期的外观特征,因此将数字化建模应用到... 文物古迹建筑在历史的发展中不断丢失其本身的特征,在时间的推移中不断改变或消失。因此,如何精确的测量保存当前文物的历史风貌是一个亟需解决的问题。数字化建模可以最大程度地保存文物在当前时期的外观特征,因此将数字化建模应用到文物重建中具有重要意义。文物重建任务中用到的大多依旧是传统的基于视觉的重建方法,这种方法一般需要多个视点图像,并且负担极高的时间成本,对于大量文物古迹的重建与更新是不够高效的。针对这一问题,文章通过无人机拍摄遥感影像完成数据采集,引入神经辐射场(Neural Radiance Fields,NeRF)方法进行文物古迹的数字化重建,构建体素,完成目标渲染。该方法可以在10min左右实现较好的重建效果,并且避免传统网格重建结果中孔洞的出现,给文物古迹建筑的重建提供了新的思路。 展开更多
关键词 遥感影像 文物保护 三维重建 神经辐射场
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部