期刊文献+
共找到106篇文章
< 1 2 6 >
每页显示 20 50 100
人体动作姿态识别方法研究综述
1
作者 梁本来 《信息记录材料》 2026年第1期18-20,26,共4页
人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适... 人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适应性和性能表现(准确性、实时性、鲁棒性等)等方面的特点,揭示了该技术领域面临的三维标注数据获取困难、复杂环境泛化能力不足及实时性与精度难以兼顾等核心挑战。针对未来发展趋势,本文探讨了轻量化模型设计、多模态融合、弱监督与自监督学习、三维时空建模、Transformer架构应用及领域自适应等关键研究方向,旨在为后续相关研究提供思路与借鉴。 展开更多
关键词 人体动作姿态识别 深度学习 计算机视觉 时空图卷积网络
在线阅读 下载PDF
姿态引导的双分支换装行人重识别网络
2
作者 周思瑶 夏楠 江佳鸿 《浙江大学学报(工学版)》 北大核心 2026年第1期71-80,共10页
针对换装行人重识别任务中由复杂环境和行人服装变化等因素导致的识别精度下降的问题,提出姿态引导的双分支换装行人重识别网络PGNet,该网络采用以外观特征为基础、由姿态特征引导的双分支结构.为了有效去除服装相关信息的干扰,降低其... 针对换装行人重识别任务中由复杂环境和行人服装变化等因素导致的识别精度下降的问题,提出姿态引导的双分支换装行人重识别网络PGNet,该网络采用以外观特征为基础、由姿态特征引导的双分支结构.为了有效去除服装相关信息的干扰,降低其对模型性能的影响,同时保留深度表征特征,设计多层次特征融合模块;构建动作关联和自然拓扑邻接矩阵,组合为双重矩阵后输入图卷积网络,并引入邻接矩阵加权机制以增强模型对姿态特征的捕捉能力;采用双线性多特征池化方法增强姿态与外观特征的互补性,从而提升识别精度.实验结果表明,PGNet在换装数据集PRCC、VC-Clothes、Celeb-reID以及Celeb-reID-light上的mAP指标分别为60.5%、84.7%、15.7%、22.6%,Rank-1指标分别为63.7%、93.3%、59.5%、41.2%,优于SirNet等其他对比方法,验证了所提方法能够有效降低服装变化的影响,并显著提高识别精度. 展开更多
关键词 换装行人重识别 姿态引导 特征融合 图卷积网络 注意力机制
在线阅读 下载PDF
VIG-SLAM:基于自适应多传感器融合的SLAM算法 被引量:1
3
作者 黄超 黄予昕 +1 位作者 杨泽彬 张毅 《电子测量与仪器学报》 北大核心 2025年第5期67-74,共8页
在缺乏全球定位系统(GPS)信号的环境中,仅依赖视觉惯性里程计的同步定位与建图(SLAM)算法虽能实现局部精确定位,但长距离移动时累积误差显著,导致定位精度下降。同时,尽管GPS能够提供全局位置信息,但在城市峡谷、隧道等复杂环境中,信号... 在缺乏全球定位系统(GPS)信号的环境中,仅依赖视觉惯性里程计的同步定位与建图(SLAM)算法虽能实现局部精确定位,但长距离移动时累积误差显著,导致定位精度下降。同时,尽管GPS能够提供全局位置信息,但在城市峡谷、隧道等复杂环境中,信号容易受到遮挡和干扰,导致定位性能不稳定,限制了其在复杂环境中的应用。为了解决上述问题,提出了VIG-SLAM算法,将视觉/惯导/轮速计紧耦合定位系统(VIW)与GPS数据进行自适应融合。首先,构建了GPS精度因子模型与异常检测机制,以评估并动态选择适合融合的高质量GPS数据。其次,提出了一种改进的自适应时间差补偿策略,解决GPS与VIW系统时间戳不匹配的问题,同时,在时间差补偿中动态调整GPS信号的权重,提升在复杂环境下的定位精度与鲁棒性。最后,构建了包含GPS约束的全局位姿图优化模型,将GPS全局定位信息作为全局约束,与VIW局部定位信息进行互补,实现大场景下的鲁棒定位。在公开数据集上以及真实实验场景中验证了所提方法的有效性,实验结果表明,相比当前主流视觉SLAM算法,提出的的VIG-SLAM算法平均定位精度至少提高15%,具有较强的鲁棒性和精度优势。 展开更多
关键词 SLAM GPS 位姿图优化 多传感器融合
原文传递
基于姿态-场景特征的视频异常检测研究
4
作者 陈志刚 张心宇 +1 位作者 刘凌枫 李航 《华中科技大学学报(自然科学版)》 北大核心 2025年第10期8-14,共7页
利用姿态骨骼点的低维和高度结构化特点,采用图卷积神经网络对姿态特征进行层次化和结构化处理,从个体姿态和个体之间的相互作用两方面进行分析;同时结合场景的丰富语义信息,引入条件变分自编码器进行异常检测.条件变分自编码器通过编... 利用姿态骨骼点的低维和高度结构化特点,采用图卷积神经网络对姿态特征进行层次化和结构化处理,从个体姿态和个体之间的相互作用两方面进行分析;同时结合场景的丰富语义信息,引入条件变分自编码器进行异常检测.条件变分自编码器通过编码场景图像和姿态特征映射,生成姿态-场景条件特征图,增强了场景特征与姿态特征的融合,提升了异常检测的准确性.该模型有效整合了姿态和场景特征,显著增强了在复杂环境下的异常行为检测能力.在上海科技、香港中文大学大道和西北工业大学校园三个异常检测数据集上,本文模型分别达到了84.3%,87.2%和69.7%的接收者操作特征曲线的曲线下面积(AUC)表现,展现了与现有技术相比的优越性. 展开更多
关键词 姿态估计 图卷积神经网络 条件变分自编码器 分层结构 视频异常检测
原文传递
联合多视图可控融合和关节相关性的三维人体姿态估计
5
作者 董婧 张鸿儒 +4 位作者 方小勇 周东生 杨鑫 张强 魏小鹏 《中国图象图形学报》 北大核心 2025年第1期254-267,共14页
目的多视图三维人体姿态估计能够从多方位的二维图像中估计出各个关节点的深度信息,克服单目三维人体姿态估计中因遮挡和深度模糊导致的不适定性问题,但如果系统性能被二维姿态估计结果的有效性所约束,则难以实现最终三维估计精度的进... 目的多视图三维人体姿态估计能够从多方位的二维图像中估计出各个关节点的深度信息,克服单目三维人体姿态估计中因遮挡和深度模糊导致的不适定性问题,但如果系统性能被二维姿态估计结果的有效性所约束,则难以实现最终三维估计精度的进一步提升。为此,提出了一种联合多视图可控融合和关节相关性的三维人体姿态估计算法CFJCNet(controlled fusion and joint correlation network),包括多视图融合优化模块、二维姿态细化模块和结构化三角剖分模块3部分。方法首先,基于极线几何框架的多视图可控融合优化模块有选择地利用极线几何原理提高二维热图的估计质量,并减少噪声引入;然后,基于图卷积与注意力机制联合学习的二维姿态细化方法以单视图中关节点之间的联系性为约束,更好地学习人体的整体和局部信息,优化二维姿态估计;最后,引入结构化三角剖分以获取人体骨长先验知识,嵌入三维重建过程,改进三维人体姿态的估计性能。结果该算法在两个公共数据集Human3.6M、Total Capture和一个合成数据集Occlusion-Person上进行了评估实验,平均关节误差为17.1 mm、18.7 mm和10.2 mm,明显优于现有的多视图三维人体姿态估计算法。结论本文提出了一个能够构建多视图间人体关节一致性联系以及各自视图中人体骨架内在拓扑约束的多视图三维人体姿态估计算法,优化二维估计结果,修正错误姿态,有效地提高了三维人体姿态估计的精确度,取得了最佳的估计结果。 展开更多
关键词 多视图 三维人体姿态估计 关节相关性 图卷积网络(GCN) 注意力机制 三角剖分
原文传递
基于时空图卷积网络与多层次特征融合的快递员3D人体姿态估计
6
作者 丁德波 史耀群 《传感技术学报》 北大核心 2025年第8期1457-1462,共6页
将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,... 将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,有效提取关节间的空间关系及时序依赖性。接着,通过引入多层次特征融合模块,融合来自不同网络层的特征信息,包括低层次的细节特征和高层次的抽象特征,从而更全面地捕捉快递员的人体关节动态变化和运动模式。为了验证所提方法的性能,在公开数据集Human3.6M上进行了实验。该数据集由视觉传感器采集得到,包含了丰富的人体姿态信息。仿真实验结果表明,所提出的方法能够显著提高三维姿态估计的精度。 展开更多
关键词 三维人体姿态估计 时空图卷积网络 多层次特征融合
在线阅读 下载PDF
联合多模态特征与结构感知的手物交互姿态估计
7
作者 王文润 党建武 +2 位作者 王阳萍 任鹏百 潘瑞 《光学精密工程》 北大核心 2025年第20期3265-3280,共16页
现实世界中手不可避免地要与物体进行交互,因此理解人手与物体的交互行为与意图具有重要的研究意义。本文针对手与物体交互过程中的相互遮挡、手部自遮挡及复杂交互背景等因素导致姿态估计精度低的问题,提出一种联合多模态特征与结构感... 现实世界中手不可避免地要与物体进行交互,因此理解人手与物体的交互行为与意图具有重要的研究意义。本文针对手与物体交互过程中的相互遮挡、手部自遮挡及复杂交互背景等因素导致姿态估计精度低的问题,提出一种联合多模态特征与结构感知的手部与交互物体三维姿态估计方法。该方法利用彩色图像和深度图像的多模态特征实现信息互补,有效解决背景复杂、手部自遮挡及手物相互遮挡的问题;其次,基于图结构分别设计手部、交互物体及手物交互结构感知模块,辅助估计更加合理和准确的手与交互物体的二维姿态;最后,将获取的二维姿态与深度图像中的深度信息进行合并,再利用纹理特征对合并得到的三维姿态进一步优化得到最终的手物交互三维姿态。为了验证本文方法的有效性,在FPHA,HO-3D等数据集开展了系列实验,手部和交互物体的姿态误差分别降低到9.62 mm和14.37 mm。实验结果表明,所提方法优于现有的手物交互姿态估计方法,具有较强的鲁棒性和泛化性。 展开更多
关键词 手物姿态估计 图卷积网络 多模态特征 结构感知
在线阅读 下载PDF
基于位姿图优化的典型舱段三维重建与几何参数测量
8
作者 付文明 李小路 +1 位作者 胡彦平 周书涛 《强度与环境》 2025年第2期55-62,共8页
激光雷达三维重建技术对物体表面形貌进行精确测量,可用于舱段表面形变分析、舱段对接参数估计等场景,但由于点云配准累积误差存在,导致重建舱段存在畸变、错位等问题。本文针对舱段三维重建累积误差问题,提出了一种基于位姿图优化的典... 激光雷达三维重建技术对物体表面形貌进行精确测量,可用于舱段表面形变分析、舱段对接参数估计等场景,但由于点云配准累积误差存在,导致重建舱段存在畸变、错位等问题。本文针对舱段三维重建累积误差问题,提出了一种基于位姿图优化的典型舱段三维重建与几何参数测量方法。该方法首先通过点云配准计算邻帧点云的基础位姿变换矩阵,利用该矩阵形成初始化位姿图节点,然后在初始化位姿图中添加邻帧约束边,利用回环约束抑制累积误差,引入次邻帧约束增强对错误配准结果的鲁棒性。采用随机采样一致性方法测量三维重建舱段的半径和轴线;采用轴线投影法估计舱段长度。仿真结果表明,针对半径100 cm、长200 cm的圆柱形舱段,在点云分辨率为0.36 cm条件下,所提方法的三维重建倒角距离精度达0.97 cm,相比传统方法精度提升了53.59%;基于高精度三维成像仪开展了实测实验,结果表明所提方法几何参数估计误差不超过1.16%。 展开更多
关键词 位姿图优化 回环约束 三维重建 非接触式测量
在线阅读 下载PDF
基于图注意力机制的三维人体姿态估计时空上下文网络
9
作者 曾正东 赵明 《计算机应用》 北大核心 2025年第10期3161-3169,共9页
近期关于人体姿态估计的研究表明,充分发挥二维姿态潜在空间信息的能力,获取具有代表性的特征,可产生更准确的三维姿态估计结果。因此,提出一种基于图注意力机制的时空上下文网络,该网络包括带滑动窗口的时间上下文网络(TCN)、由肢体引... 近期关于人体姿态估计的研究表明,充分发挥二维姿态潜在空间信息的能力,获取具有代表性的特征,可产生更准确的三维姿态估计结果。因此,提出一种基于图注意力机制的时空上下文网络,该网络包括带滑动窗口的时间上下文网络(TCN)、由肢体引导的全局图注意力机制网络(EGAT)和基于姿态语法的局部图注意力卷积网络(PGCN)。首先,使用STCN将长序列的二维关节位置转化为单序列的人体姿态潜在特征,从而有效聚合和利用远、近距离的人体姿态信息,并大幅降低计算成本。其次,提出EGAT模块,以有效计算全局空间上下文。该模块将人体边缘节点视为“交通枢纽”,为它们与其他节点之间的信息交换建立桥梁。再次,利用图注意力机制进行自适应权值分配,对人体关节进行全局上下文计算。最后,设计PGCN模块,利用图卷积网络(GCN)计算和建模局部空间上下文,它强调人体对称节点的运动一致性和人体骨骼的运动关联结构。在Human3.6M和HumanEva-Ⅰ这2个复杂的标准数据集上评估所提模型。实验结果表明,所提模型具有更优越的性能,在输入帧长度为81的情况下,所提模型在数据集Human3.6M上的每个关节的平均位置误差(MPJPE)达43.5 mm,与目前先进算法MCFNet(Multi-scale Cross Fusion Network)相比降低了10.5%,体现出更高的准确度。 展开更多
关键词 三维人体姿态估计 图注意力 时间上下文 空间上下文 时间卷积网络
在线阅读 下载PDF
基于改进AlphaPose的人体特征行为识别方法及应用
10
作者 董贇 张希翔 +3 位作者 艾徐华 银源 宁梓宏 李自品 《武汉大学学报(工学版)》 北大核心 2025年第11期1767-1775,共9页
结合电网巡检人员过程评价和监管的实际需求,针对人体行为复杂多变且检测目标尺度差异大等问题,提出一种基于改进AlphaPose的人体特征行为识别方法。该方法首先设计一种分阶段多尺度目标检测网络(改进SRCNN(super-resolution convolutio... 结合电网巡检人员过程评价和监管的实际需求,针对人体行为复杂多变且检测目标尺度差异大等问题,提出一种基于改进AlphaPose的人体特征行为识别方法。该方法首先设计一种分阶段多尺度目标检测网络(改进SRCNN(super-resolution convolutional neural network)+ScaledNet);然后用分阶段多尺度目标检测网络代替AlphaPose中的目标检测模块,并引入参数化姿态非极大值抑制算法,以提高人体姿态估计的速度和精度;最后利用改进人体姿态估计网络(分阶段多尺度目标检测网络+SPPE(single-person pose estimator))进行人体姿态估计获取人体关节点序列图,并设计一种时空图卷积行为识别网络对人体特征行为进行识别。测试结果表明,所设计的分阶段多尺度目标检测网络的精度和速度分别达到90.85%和42.7帧/s;改进的人体姿态估计网络的精度和速度分别达到80.5%和20.3帧/s。应用案例表明,该方法对巡检人员特征行为识别的平均准确率高达94.75%。该方法可广泛应用于电力巡检或其他场景人员作业过程监管等领域。 展开更多
关键词 特征行为识别 多尺度目标检测 人体姿态估计 时空图卷积 巡检过程监管
原文传递
GNSS拒止环境下基于共视图优化的无人机影像快速位姿估计与应急建图
11
作者 辜第桢 杨耘 +5 位作者 赵波 李祖锋 郝国朴 陈世昌 杨成生 唐一亮 《地球科学与环境学报》 北大核心 2025年第5期987-998,共12页
针对全球导航卫星系统(GNSS)拒止环境下无人机影像位姿估计效率低的问题,提出一种基于共视图优化的快速建图算法——NSG-VLAD算法。首先,利用尺度不变特征变换(SIFT)提取每张影像的特征,并利用局部聚合描述子向量(VLAD)算法将特征描述... 针对全球导航卫星系统(GNSS)拒止环境下无人机影像位姿估计效率低的问题,提出一种基于共视图优化的快速建图算法——NSG-VLAD算法。首先,利用尺度不变特征变换(SIFT)提取每张影像的特征,并利用局部聚合描述子向量(VLAD)算法将特征描述子聚合为全局特征向量;其次,利用基于图索引的近似最近邻搜索(ANNS)算法进行相似影像的检索;最后,对各个相似影像对构建共视图,并进行迭代匹配,从而提升影像特征匹配、影像位姿估计及应急场景建图的效率。在此基础上,利用NPU_FACTORY、NPU_PARK数据集以及3个自制数据集,将NSG-VLAD算法与具有代表性的Colmap开源软件和Metashape、Pix4Dmapper商业软件进行对比验证。结果表明:NSG-VLAD算法较Metashape商业软件重建速度提高了3倍,比Colmap开源软件快10倍以上,重投影误差优于Colmap开源软件和Metashape商业软件;在应急测绘任务下的三维点云建图速度高于同类方法至少2倍,验证了NSG-VLAD算法在地震灾害等GNSS拒止环境下的应急测绘中具有良好应用前景。 展开更多
关键词 无人机影像序列 应急场景 影像检索 共视图 特征匹配 位姿估计 运动恢复结构
在线阅读 下载PDF
基于回环边残差聚焦权重模型的位姿图优化算法
12
作者 冒凡 魏国亮 +2 位作者 蔡洁 郑劲康 简单 《计算机应用研究》 北大核心 2025年第1期149-155,共7页
基于图优化的同时定位与建图(SLAM)系统中含有大噪声的回环边,可能严重阻碍优化器迅速收敛到最优解,显著降低定位精确性和地图一致性。因此,针对大噪声回环边的优化算法的鲁棒性至关重要。引入K-means聚类思想,对回环边残差值进行分类,... 基于图优化的同时定位与建图(SLAM)系统中含有大噪声的回环边,可能严重阻碍优化器迅速收敛到最优解,显著降低定位精确性和地图一致性。因此,针对大噪声回环边的优化算法的鲁棒性至关重要。引入K-means聚类思想,对回环边残差值进行分类,进而建立了一种新的残差阈值模型,自适应调整回环边在优化时的权重,减少回环边对优化的影响;然后,基于迭代重加权最小二乘的思想形成了RW-RLSPGO算法(residual weighted enhancement for recursive least squares pose graph optimization algorithm,RWRLSPGO);最后,在模拟和真实的PGO数据集上进行蒙特卡罗实验。实验结果表明,RW-RLSPGO算法在准确性和鲁棒性方面都取得了显著的提高,验证了其在大噪声环境下的有效性。 展开更多
关键词 同时定位与建图 位姿图优化 回环边 大噪声 聚类
在线阅读 下载PDF
多级图特征融合引导相机位姿回归
13
作者 司钧文 周自维 《光学精密工程》 北大核心 2025年第6期928-944,共17页
为了提高复杂场景下相机位姿估计的精度和稳定性,本文自主设计了ResGraphLoc网络,该网络通过引入残差网络与图注意力机制,进一步提高相机在遮挡、光照变化和低纹理场景下的位姿回归精度问题。该网络采用ResNet101作为特征编码器,通过改... 为了提高复杂场景下相机位姿估计的精度和稳定性,本文自主设计了ResGraphLoc网络,该网络通过引入残差网络与图注意力机制,进一步提高相机在遮挡、光照变化和低纹理场景下的位姿回归精度问题。该网络采用ResNet101作为特征编码器,通过改进的残差块增强显著特征提取能力。利用图注意力层融合多级特征图,并通过多头自注意力机制实现特征信息扩散和聚合。最后,通过非线性MLP层从特征嵌入中提取位置和角度特征,完成端到端相机位姿回归。在大型室外数据集上,ResGraphLoc模型的位姿误差优于现有算法。在LOOP和FULL场景下,位姿回归结果分别为7.18 m,2.48°与16.96 m,3.16°,相比基准模型提升超过25%。在4Seasons数据集的Neighborhood场景下,室外定位误差最低可以达到1.40 m,0.76°。在纹理缺失及重复的室内数据集下,位置角度回归结果分别可以达到0.08 m,3.25°。实验结果验证了ResGraphLoc在复杂环境下的高精度和稳定性,能有效应对遮挡、光照变化和低纹理场景。 展开更多
关键词 计算机视觉 相机位姿回归 相机定位 图注意力 多级特征融合
在线阅读 下载PDF
基于对偶的快速3D位姿图验证方法
14
作者 李雨洁 魏国亮 蔡洁 《控制工程》 北大核心 2025年第5期797-805,共9页
位姿图优化(pose graph optimization, PGO)是同时定位与建图(simultaneous localization and mapping, SLAM)中最重要的后端优化技术之一,旨在搜寻具有全局最优性的解。为了检验给定候选解的全局最优性,提出了一种基于对偶的快速3D位... 位姿图优化(pose graph optimization, PGO)是同时定位与建图(simultaneous localization and mapping, SLAM)中最重要的后端优化技术之一,旨在搜寻具有全局最优性的解。为了检验给定候选解的全局最优性,提出了一种基于对偶的快速3D位姿图验证技术。首先,改写原始的PGO问题公式,建立一个复杂度更低的等价优化问题;其次,推导对应的拉格朗日对偶问题,并利用对偶问题的性质评估候选解的质量;最后,在模拟和真实的SLAM数据集上进行实验评估。结果表明,该算法具有可伸缩性、计算成本低等优点,可以有效地进行最优性验证。 展开更多
关键词 位姿图优化 同步定位与建图 非线性优化 拉格朗日对偶
原文传递
GMambaScanX:基于双流并行的三维人体姿态估计
15
作者 汤昊霖 袁煜麟 +3 位作者 卢笑 汪鲁才 吴成中 王耀南 《武汉大学学报(理学版)》 北大核心 2025年第4期463-472,共10页
基于Transformer的模型通过编码所有的关节点之间的连接关系,捕获全局视野的数据依赖关系,因而在三维人体姿态估计任务中取得了优秀性能。然而这类方法无法对关节局部依赖关系进行建模,且存在模型计算复杂度随序列长度平方增长的计算资... 基于Transformer的模型通过编码所有的关节点之间的连接关系,捕获全局视野的数据依赖关系,因而在三维人体姿态估计任务中取得了优秀性能。然而这类方法无法对关节局部依赖关系进行建模,且存在模型计算复杂度随序列长度平方增长的计算资源浪费问题。为了解决上述问题,本文将人体运动过程定义为状态空间模型的序列输入和输出过程,提出基于GCN(Graph Convolutional Network)和Mamba双流并行的人体结构扫描三维姿态估计方法GMambaScanX,GCN模型对人体运动序列时空邻接关系进行建模,增强模型的局部依赖关系捕获能力。Mamba模型对人体运动序列时空长程关系进行建模,增强模型的全局依赖关系捕获能力,提出两种MambaScan扫描策略,针对人体运动状态转移特征的时序关节扫描,增强模型在时间维度对人体运动特征的理解能力;针对人体关节结构特征的人体结构先验引导的空间关节扫描,增强模型在空间维度对人体结构特征的理解能力。GMambaScanX在Human3.6M数据集上进行训练验证,平均关节位置误差为39.8 mm,参数量仅为MotionBERT的12.4%(5.3×10^(6))。相比于进行全连接建模,GMambaScanX能够更好地提取人体结构特征,高效使用参数,提高模型的有效性与效率。 展开更多
关键词 三维人体姿态估计 状态空间模型 图卷积网络 人体结构关节点扫描
原文传递
自调节图卷积UNet的三维人体姿态估计方法
16
作者 马金林 崔琦磊 +2 位作者 马自萍 武江涛 曹浩杰 《北京航空航天大学学报》 北大核心 2025年第1期63-74,共12页
基于图卷积网络的三维人体姿态估计方法无法提取关节点的多尺度特征和未充分利用相邻节点的拓扑关系问题,提出自调节图卷积UNet的三维人体姿态估计方法M-Joint-UNet。M-Joint-UNet方法由Joint-UNet、自调节图卷积和融合损失3部分组成:Jo... 基于图卷积网络的三维人体姿态估计方法无法提取关节点的多尺度特征和未充分利用相邻节点的拓扑关系问题,提出自调节图卷积UNet的三维人体姿态估计方法M-Joint-UNet。M-Joint-UNet方法由Joint-UNet、自调节图卷积和融合损失3部分组成:Joint-UNet通过关节点池化与去池化改变特征图大小,以提取关节点的不同尺度特征;自调节图卷积通过可学习矩阵自动调节相邻节点或人体骨架结构的关系;使用L_(1)和L_(2)融合的损失缓解梯度爆炸。对比实验表明:所提方法在参数量和估计性能方面均获得了最优的结果,以Human3.6M的二维真实关节点作为输入的参数量仅为0.54×10^(6),MPJPE和P-MPJPE值分别为37.81 mm和30.21 mm。 展开更多
关键词 三维人体姿态估计 图卷积 Graph-UNet 关节点池化 权重矩阵
原文传递
武装人员危险行为识别系统轻量化设计
17
作者 代敏 詹航 +2 位作者 陈劲 唐雪松 李浩 《兵器装备工程学报》 北大核心 2025年第S1期188-192,223,共6页
提出一种轻量化的武装人员危险行为识别系统。对采集的视频流数据进行预处理,采用YOLOv3-Tiny网络提取人体框,再用Alphapose方法进行人体姿态估计,获得骨骼关节点数据并使用ST-GCN网络对骨骼序列进行分类。测试结果表明,系统在验证集上... 提出一种轻量化的武装人员危险行为识别系统。对采集的视频流数据进行预处理,采用YOLOv3-Tiny网络提取人体框,再用Alphapose方法进行人体姿态估计,获得骨骼关节点数据并使用ST-GCN网络对骨骼序列进行分类。测试结果表明,系统在验证集上的识别准确率可达99.48%,部署在边缘设备上平均处理速度可达52 fps,证明了本系统实现轻量化的同时兼顾了准确性与实时性,具备部署至陆上无人装备系统的可行性与通用性。 展开更多
关键词 目标检测 姿态估计 行为识别 图卷积
在线阅读 下载PDF
基于图结构引导和位置信息强化的人体姿态估计
18
作者 关欣 周子健 李锵 《吉林大学学报(工学版)》 北大核心 2025年第10期3283-3295,共13页
高自由度的肢体常构成各种复杂的姿态,极易产生关键点被遮挡的现象,定位遮挡关键点是人体姿态估计的难点之一,针对上述难点,提出了一种图结构引导并强化关键点位置信息的人体姿态估计方法。首先该方法在高分辨率网络中融入位置信息强化... 高自由度的肢体常构成各种复杂的姿态,极易产生关键点被遮挡的现象,定位遮挡关键点是人体姿态估计的难点之一,针对上述难点,提出了一种图结构引导并强化关键点位置信息的人体姿态估计方法。首先该方法在高分辨率网络中融入位置信息强化模块,用于提升可见关键点空间位置信息的表征精度。然后,在主干网络并行支路中引入视觉图神经模块,引导网络提取包含人体关键点的相关特征,在像素坐标空间中挖掘关键点之间局部和全局的拓扑连接关系,以便推测被遮挡关键点的位置信息。最后,结合关键点热图聚合单元和语义图卷积网络,在语义空间中更新各关键点间的亲和力权重,表示躯干结构约束下关键点之间的拓扑依赖关系,进一步优化被遮挡关键点的估计。本文模型在COCO2017测试集上的平均精度达到78.1%,能够精准估计复杂姿态中易被遮挡的关键点。 展开更多
关键词 计算机视觉 人体姿态估计 关键点 图卷积
原文传递
基于多模态感知的敬老院智能机器人SLAM算法研究
19
作者 王小涛 张洪艳 +2 位作者 刘惠杰 张海涛 孙仁杰 《河南科技》 2025年第24期22-27,共6页
【目的】旨在解决敬老院智能机器人SLAM建图存在的边缘错位、建图空白、全局地图不一致的问题。【方法】通过研究对比Gmapping、ORB-SLAM2、RTAB-Map建图算法,提出利用GTSAM的位姿图全局优化机制、非线性最小二乘约束求解、构建扩展卡... 【目的】旨在解决敬老院智能机器人SLAM建图存在的边缘错位、建图空白、全局地图不一致的问题。【方法】通过研究对比Gmapping、ORB-SLAM2、RTAB-Map建图算法,提出利用GTSAM的位姿图全局优化机制、非线性最小二乘约束求解、构建扩展卡尔曼滤波(EKF)多传感器融合架构来优化RTAB-Map建图算法。采用优化后的RTAB-Map建图算法在真实环境下融合单线激光雷达、IMU、RGB-D等3种传感器的数据进行实地建图。【结果】试验结果显示,机器人建图轨迹漂移率降低68%,机器人状态估计误差下降42%,室内狭小空间建图边缘对齐误差≤5 cm,弱光场景地图完整度提升89%且动态干扰下系统稳定性也有所提升,环境建图过程中对于缓慢行动的老人(动态物体)过滤性能提升50%。【结论】改进后的RTAB-Map算法可以解决机器人在敬老院SLAM建图过程中遇到的边缘错位、建图空白、全局地图不一致的问题,为机器人在敬老院的应用提供一定的技术支撑。 展开更多
关键词 多模态融合 位姿图优化 RTAB-Map RGB-D 激光雷达
在线阅读 下载PDF
一种基于视觉闭环修正的激光里程计算法
20
作者 韦有义 冯绍权 《测绘地理信息》 2025年第3期16-19,共4页
针对大场景激光里程计误差累积及其导致的纯激光闭环检测失效问题,提出了一种融合视觉闭环的激光里程计算法。首先采用点云分割技术实现基于特征的激光里程计算法,然后结合视觉检测的闭环约束进行全局位姿图优化,实现高精度位姿估计及... 针对大场景激光里程计误差累积及其导致的纯激光闭环检测失效问题,提出了一种融合视觉闭环的激光里程计算法。首先采用点云分割技术实现基于特征的激光里程计算法,然后结合视觉检测的闭环约束进行全局位姿图优化,实现高精度位姿估计及地图构建。采用KITTI开源数据集进行实验,并将本文算法与LOAM(LiDAR odometry and mapping)算法和LeGO-LOAM(lightweight and ground-optimized-LOAM)算法进行对比。结果表明,本文算法的位姿估计精度最高,综合位姿估计仅需31.3 ms,满足自动驾驶汽车实时定位与建图需求。 展开更多
关键词 里程计 闭环检测 点云分割 位姿图 定位与建图
原文传递
上一页 1 2 6 下一页 到第
使用帮助 返回顶部