期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Geometry-Enhanced Implicit Function for Detailed Clothed Human Reconstruction With RGB-D Input
1
作者 Pengpeng Liu Zhi Zeng +2 位作者 Qisheng Wang Min Chen Guixuan Zhang 《CAAI Transactions on Intelligence Technology》 2025年第3期858-870,共13页
Realistic human reconstruction embraces an extensive range of applications as depth sensors advance.However,current stateof-the-art methods with RGB-D input still suffer from artefacts,such as noisy surfaces,non-human... Realistic human reconstruction embraces an extensive range of applications as depth sensors advance.However,current stateof-the-art methods with RGB-D input still suffer from artefacts,such as noisy surfaces,non-human shapes,and depth ambiguity,especially for the invisible parts.The authors observe the main issue is the lack of geometric semantics without using depth input priors fully.This paper focuses on improving the representation ability of implicit function,exploring an effective method to utilise depth-related semantics effectively and efficiently.The proposed geometry-enhanced implicit function enhances the geometric semantics with the extra voxel-aligned features from point clouds,promoting the completion of missing parts for unseen regions while preserving the local details on the input.For incorporating multi-scale pixel-aligned and voxelaligned features,the authors use the Squeeze-and-Excitation attention to capture and fully use channel interdependencies.For the multi-view reconstruction,the proposed depth-enhanced attention explicitly excites the network to“sense”the geometric structure for a more reasonable feature aggregation.Experiments and results show that our method outperforms current RGB and depth-based SOTA methods on the challenging data from Twindom and Thuman3.0,and achieves a detailed and completed human reconstruction,balancing performance and efficiency well. 展开更多
关键词 deep implicit function depth-enhanced attention geometry-enhanced human reconstruction RGB-D
在线阅读 下载PDF
基于深度学习的隐函数点云表面重建方法
2
作者 胡鑫 何晓谊 孙剑 《工程数学学报》 北大核心 2025年第3期490-508,共19页
随着三维扫描和点云数据处理技术的迅速发展,点云表面重建已成为计算机图形学与计算机视觉领域的重要研究方向。点云表面重建旨在从离散、不规则分布的点云数据中恢复物体或场景的连续表面。近年来,隐函数方法因其良好的鲁棒性与灵活性... 随着三维扫描和点云数据处理技术的迅速发展,点云表面重建已成为计算机图形学与计算机视觉领域的重要研究方向。点云表面重建旨在从离散、不规则分布的点云数据中恢复物体或场景的连续表面。近年来,隐函数方法因其良好的鲁棒性与灵活性备受瞩目,特别是深度学习的引入,显著提升了其对复杂几何的重建性能。在此背景下,隐函数用于点云表面重建的研究成果不断涌现,使得追踪和把握其全貌愈加困难,因此迫切需要综述性文献梳理其基本原理、关键技术和发展脉络。鉴于此,首先回顾隐函数在点云表面重建中的基本原理和发展历程,随后从隐函数定义、隐函数类型、技术发展、损失函数、数据集、评价指标六个方面,对现有基于隐函数的点云表面重建方法展开系统性综述。最后,总结了该领域面临的关键挑战,如低质量点云处理、表面重建实时性以及序列点云重建问题,并展望了未来的研究方向。综述期望为从事点云重建及相关领域研究的学者提供全面的技术总结,助力其深入了解领域动态、高效定位前沿问题。 展开更多
关键词 深度学习 隐函数 点云 表面重建
在线阅读 下载PDF
基于法线贴图增强隐式函数的单图像三维头部重建
3
作者 刘乐元 刘旭 +1 位作者 孙见弛 陈靓影 《计算机辅助设计与图形学学报》 CSCD 北大核心 2024年第12期1906-1919,共14页
三维头部重建是建构元宇宙的基础技术之一,在影视制作、游戏娱乐、智能教育等领域也具备广阔的应用前景.从单图像重建三维头部模型可以最大程度地节省成本并大幅提高操作的便捷性.然而,单图像三维头部重建是一个非适定问题,现有算法普... 三维头部重建是建构元宇宙的基础技术之一,在影视制作、游戏娱乐、智能教育等领域也具备广阔的应用前景.从单图像重建三维头部模型可以最大程度地节省成本并大幅提高操作的便捷性.然而,单图像三维头部重建是一个非适定问题,现有算法普遍存在重建的三维头部模型保真度低、细节少以及算法泛化能力差等问题.为此,文中提出了一种基于法线贴图增强隐式函数的单图像三维头部重建算法.首先,设计了一个法线贴图估计子网络从单幅图像估计头部法线贴图;其次,将三维头部模型表面看作由隐式函数描述的水平集,建立了端到端的深度神经网络,从输入图像及法线贴图中提取视觉特征并判别三维空间中各点位于该水平集等值面的概率.文中算法在FCH(FaceScape,CoMA,HeadSpace)和FaceVerse公共数据集上所重建三维头部模型的平均倒角距离分别为0.7696 mm和1.3080 mm,大幅优于对比的单图像三维头部重建算法;在2个从互联网采集的数据集上的实验结果也表明,文中算法能从包含不同年龄、人种、性别、面部表情的单幅肖像图像中重建出具备高保真度和丰富细节的三维头部模型,且具备强大泛化能力. 展开更多
关键词 三维头部重建 单图像 深度神经网络 隐式函数 法线贴图
在线阅读 下载PDF
基于深度学习的单图像三维人体重建研究综述 被引量:3
4
作者 刘乐元 孙见弛 +2 位作者 高韵琪 高常鑫 陈靓影 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期98-122,共25页
对近年来基于深度学习的单图像三维人体重建的研究现状和发展趋势进行了总结.首先,从模型表示和计算方法两个方面梳理了当前主要的单图像三维人体重建算法.在模型表示上详细介绍了四种常见表示方式及它们之间的相互转化关系,包括深度图... 对近年来基于深度学习的单图像三维人体重建的研究现状和发展趋势进行了总结.首先,从模型表示和计算方法两个方面梳理了当前主要的单图像三维人体重建算法.在模型表示上详细介绍了四种常见表示方式及它们之间的相互转化关系,包括深度图像与点云表示、参数化人体模型表示、体素及语义体素表示及隐式曲面函数表示.在计算方法上深入描述了基于上述四种表示方式所提出的算法,并分析了其优缺点;接着,介绍了单图像三维人体重建常用的公共数据集和客观评价指标;然后,在公共数据集上从客观指标和可视化两个角度对当前先进方法进行了评价和对比;最后,在实验结果的基础上总结了当前方法存在的问题和挑战,并展望了单图像三维人体重建未来潜在的研究方向. 展开更多
关键词 三维着衣人体重建 单图像三维重建 深度学习 点云 体素 参数化模型 隐式曲面函数 混合模型
原文传递
基于深度哈密顿神经网络的物料提升机的鲁棒控制 被引量:1
5
作者 崔文豪 郭宇飞 +2 位作者 江源 王志刚 郝志强 《农业装备与车辆工程》 2024年第8期82-87,共6页
安装基座的随机振动给物料提升机系统带来不确定性,对此提出一种基于深度神经网络的非线性鲁棒控制策略。首先,采用一种嵌入哈密顿力学先验的深度神经网络(HNN),拟合了系统的动力学模型;然后,以此模型为基础,结合一种隐式Lyapunov(IL)函... 安装基座的随机振动给物料提升机系统带来不确定性,对此提出一种基于深度神经网络的非线性鲁棒控制策略。首先,采用一种嵌入哈密顿力学先验的深度神经网络(HNN),拟合了系统的动力学模型;然后,以此模型为基础,结合一种隐式Lyapunov(IL)函数,设计了系统的鲁棒镇定控制器。仿真显示,所提出的基于深度哈密顿神经网络结合IL函数控制器(HIL)的控制效果与基于精确模型的控制器IL几乎完全一致;相较传统的基于黑箱神经网络模型的IL控制(BIL)、基于误差模型(IL-E),其收敛时间分别减少了25.9%和32.5%。结果表明,所提出的控制策略能准确表征系统的非线性动力学特征,有效抑制基座振动不确定的影响,实现物料提升机的快速精确鲁棒镇定。 展开更多
关键词 基座振动 隐式Lyapunov函数 鲁棒控制 深度神经网络 物料提升机
在线阅读 下载PDF
基于参数模型和法线推理的单视图三维人体隐式重建 被引量:2
6
作者 刘峰 周弈帆 《南京邮电大学学报(自然科学版)》 北大核心 2023年第3期1-10,共10页
为了克服单视图三维人体重建中出现的伪影及肢体残缺现象,提出了一种基于参数模型和法线推理的三维人体隐式重建算法(Parametric⁃Model and Normal Inference,PMNI),该方法能够从单一RGB图像重建出包含服装的三维人体。网络的输入仅为... 为了克服单视图三维人体重建中出现的伪影及肢体残缺现象,提出了一种基于参数模型和法线推理的三维人体隐式重建算法(Parametric⁃Model and Normal Inference,PMNI),该方法能够从单一RGB图像重建出包含服装的三维人体。网络的输入仅为一张包含人物全身的RGB图像,首先基于图卷积神经网络预测对应的SMPL参数模型,接着基于条件GAN(Generative Adversarial Networks)网络生成人物的后视图像,并分别从前后视图中提取法线特征,最后将它们作为深度隐式函数的额外参数辅助训练。实验结果表明,相较于传统方法,该方法有效提升了重建结果的整体质量和表面细节。得益于参数体和法线作为先验,该方法也可以很好地处理一些复杂人体姿态。 展开更多
关键词 三维重建 深度隐式函数 参数体模型 法线预测 人体数字化 单视图
在线阅读 下载PDF
基于深度三维模型表征的类别级六维位姿估计 被引量:2
7
作者 桑晗博 林巍峣 叶龙 《中国传媒大学学报(自然科学版)》 2022年第4期50-56,共7页
类别级物体六维位姿估计在机器人操作、自动驾驶和增强现实等领域有着广泛的应用。相较于实例级任务,类别级六维位姿估计的难点主要在于类别先验特征基础上的类内差异。本文采用一种基于有向距离场(Signed Distance Field,SDF)的深度三... 类别级物体六维位姿估计在机器人操作、自动驾驶和增强现实等领域有着广泛的应用。相较于实例级任务,类别级六维位姿估计的难点主要在于类别先验特征基础上的类内差异。本文采用一种基于有向距离场(Signed Distance Field,SDF)的深度三维模型表征提取出类别级先验共享信息,同时依据输入深度图像的几何形状特征搜索最优的形状隐变量,两者结合重建出标准空间内的完整实例模型。通过学习深度点与标准化实例模型的点对匹配关系,即可求解出物体的六维位姿参数。实验证明本文提出的类别级六维位姿估计架构具有良好的性能和对类内新物体的泛化能力。 展开更多
关键词 类别级物体六维位姿估计 深度三维模型表征
在线阅读 下载PDF
Learning Hierarchical Adaptive Code Clouds for Neural 3D Shape Representation
8
作者 Yuanxun Lu Xinya Ji +1 位作者 Hao Zhu Xun Cao 《Machine Intelligence Research》 2025年第2期304-323,共20页
Neural implicit representation(NIR)has attracted significant attention in 3D shape representation for its efficiency,generalizability,and flexibility compared with traditional explicit representations.Previous works u... Neural implicit representation(NIR)has attracted significant attention in 3D shape representation for its efficiency,generalizability,and flexibility compared with traditional explicit representations.Previous works usually parameterize shapes with neural feature grids/volumes,which prove to be inefficient for the discrete position constraints of the representations.While recent advances make it possible to optimize continuous positions for the latent codes,they still lack self-adaptability to represent various kinds of shapes well.In this paper,we introduce a hierarchical adaptive code cloud(HACC)model to achieve an accurate and compact implicit 3D shape representation.Specifically,we begin by assigning adaptive influence fields and dynamic positions to latent codes,which are optimizable during training,and propose an adaptive aggregation function to fuse the contributions of candidate latent codes with respect to query points.In addition,these basic modules are stacked hierarchically with gradually narrowing influence field thresholds and,therefore,heuristically forced to focus on capturing finer structures at higher levels.These formulations greatly improve the distribution and effectiveness of local latent codes and reconstruct shapes from coarse to fine with high accuracy.Extensive qualitative and quantitative evaluations both on single-shape reconstruction and large-scale dataset representation tasks demonstrate the superiority of our method over state-of-the-art approaches. 展开更多
关键词 Representation learning shape analysis deep implicit function 3D reconstruction 3D modeling
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部