期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
一种融合语义图卷积与自注意力机制的三维人体姿态估计方法
1
作者 童立靖 英溢卓 曹楠 《计算机工程与科学》 北大核心 2026年第3期521-530,共10页
针对三维人体姿态估计不易捕捉人体关节序列的全局特征、估计精度不高的问题,提出了一种融合语义图卷积与自注意力机制的三维人体姿态估计方法。首先,为提升从二维人体姿态序列映射到三维人体姿态序列过程中的特征提取效果,在语义图卷... 针对三维人体姿态估计不易捕捉人体关节序列的全局特征、估计精度不高的问题,提出了一种融合语义图卷积与自注意力机制的三维人体姿态估计方法。首先,为提升从二维人体姿态序列映射到三维人体姿态序列过程中的特征提取效果,在语义图卷积网络中融入自注意力机制,进行基于局部特征与全局特征相融合的空间特征提取;其次,对MLP-Mixer网络的通道混合模块加以改进,引入了语义图卷积网络与U型MLP结构进行时序特征的提取;最后,基于二维人体图像的融合特征与提取的时序特征进行三维人体姿态估计。在三维人体姿态估计数据集Human3.6M上进行实验,将所提出的方法与当前主流的三维人体姿态估计方法进行对比,实验结果表明该方法在平均误差指标MPJPE和PA-MPJPE上相比次优方法分别下降约4.5 mm和0.2 mm,实验结果验证了所提出方法的有效性。 展开更多
关键词 三维人体姿态估计 语义图卷积 MLP-Mixer模型 自注意力机制
在线阅读 下载PDF
人体动作姿态识别方法研究综述
2
作者 梁本来 《信息记录材料》 2026年第1期18-20,26,共4页
人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适... 人体动作识别技术是计算机视觉领域的重要研究方向。本文综述了当前主流的人体动作姿态识别方法,包括基于图像的姿态估计、基于视频的时序分析、三维空间姿态重建及基于骨架的动作识别等方法,通过对比分析各类方法在计算复杂度、场景适应性和性能表现(准确性、实时性、鲁棒性等)等方面的特点,揭示了该技术领域面临的三维标注数据获取困难、复杂环境泛化能力不足及实时性与精度难以兼顾等核心挑战。针对未来发展趋势,本文探讨了轻量化模型设计、多模态融合、弱监督与自监督学习、三维时空建模、Transformer架构应用及领域自适应等关键研究方向,旨在为后续相关研究提供思路与借鉴。 展开更多
关键词 人体动作姿态识别 深度学习 计算机视觉 时空图卷积网络
在线阅读 下载PDF
基于图卷积网络的三维人体姿态估计方法研究
3
作者 谷岳临 杨大为 《信息记录材料》 2026年第4期1-5,共5页
针对现有3D人体姿态估计方法依赖预定义图结构、难以捕捉全局依赖关系,以及2D转3D过程中的深度模糊问题,本研究提出了参数化路由邻接调制图卷积网络(PRAMGCN-Net)架构。该架构通过引入可动态学习关节关系的路由邻接模块与融合自适应归... 针对现有3D人体姿态估计方法依赖预定义图结构、难以捕捉全局依赖关系,以及2D转3D过程中的深度模糊问题,本研究提出了参数化路由邻接调制图卷积网络(PRAMGCN-Net)架构。该架构通过引入可动态学习关节关系的路由邻接模块与融合自适应归一化的图卷积结构,实现了对复杂人体姿态的稳健建模与深度信息的有效推断。实验结果表明,在Human3.6M数据集上,本方法的平均每关节位置误差(MPJPE)与普式平均关节误差(PA-MPJPE)均优于主流方法;在NTU RGB+D 60数据集上达到93.20%的准确率,验证了其优越的估计精度与泛化能力。 展开更多
关键词 3D人体姿态估计 图卷积神经网络 基于骨架的姿态估计 人体行为检测
在线阅读 下载PDF
面向多机协同探索的分布式SLAM方法
4
作者 邓开阳 郑永航 +2 位作者 罗义藩 张航铖 解杨敏 《计算机工程与设计》 北大核心 2026年第2期560-567,共8页
传统协同定位依赖高频位姿或观测数据交互,难以适应带宽受限环境;单机回环检测框架在多机协同中难以有效融合时空关联性,制约全局地图一致性提升。针对上述问题,提出了一种基于特征点集的分布式SLAM新方法。利用LIOSAM作为各机器人的前... 传统协同定位依赖高频位姿或观测数据交互,难以适应带宽受限环境;单机回环检测框架在多机协同中难以有效融合时空关联性,制约全局地图一致性提升。针对上述问题,提出了一种基于特征点集的分布式SLAM新方法。利用LIOSAM作为各机器人的前端里程计,通过关键帧提取轻量化特征点集,并基于最小生成树的邻域广播机制共享数据,降低通信开销。运用RANSAC和ICP算法进行机器人间的回环检测和精确配准。将机器人内部和机器人间的约束整合到了多机器人位姿图中,优化了多机器人系统的位姿估计,增强了系统的鲁棒性与精度。实验结果表明,所提方法能有效减轻机器人间的通信开销,并提升多机器人系统在复杂环境中的导航与定位精度。 展开更多
关键词 同时定位与建图 多机器人协同 位姿图 通信开销 回环检测 地图融合 地图优化
在线阅读 下载PDF
姿态引导的双分支换装行人重识别网络
5
作者 周思瑶 夏楠 江佳鸿 《浙江大学学报(工学版)》 北大核心 2026年第1期71-80,共10页
针对换装行人重识别任务中由复杂环境和行人服装变化等因素导致的识别精度下降的问题,提出姿态引导的双分支换装行人重识别网络PGNet,该网络采用以外观特征为基础、由姿态特征引导的双分支结构.为了有效去除服装相关信息的干扰,降低其... 针对换装行人重识别任务中由复杂环境和行人服装变化等因素导致的识别精度下降的问题,提出姿态引导的双分支换装行人重识别网络PGNet,该网络采用以外观特征为基础、由姿态特征引导的双分支结构.为了有效去除服装相关信息的干扰,降低其对模型性能的影响,同时保留深度表征特征,设计多层次特征融合模块;构建动作关联和自然拓扑邻接矩阵,组合为双重矩阵后输入图卷积网络,并引入邻接矩阵加权机制以增强模型对姿态特征的捕捉能力;采用双线性多特征池化方法增强姿态与外观特征的互补性,从而提升识别精度.实验结果表明,PGNet在换装数据集PRCC、VC-Clothes、Celeb-reID以及Celeb-reID-light上的mAP指标分别为60.5%、84.7%、15.7%、22.6%,Rank-1指标分别为63.7%、93.3%、59.5%、41.2%,优于SirNet等其他对比方法,验证了所提方法能够有效降低服装变化的影响,并显著提高识别精度. 展开更多
关键词 换装行人重识别 姿态引导 特征融合 图卷积网络 注意力机制
在线阅读 下载PDF
VIG-SLAM:基于自适应多传感器融合的SLAM算法 被引量:3
6
作者 黄超 黄予昕 +1 位作者 杨泽彬 张毅 《电子测量与仪器学报》 北大核心 2025年第5期67-74,共8页
在缺乏全球定位系统(GPS)信号的环境中,仅依赖视觉惯性里程计的同步定位与建图(SLAM)算法虽能实现局部精确定位,但长距离移动时累积误差显著,导致定位精度下降。同时,尽管GPS能够提供全局位置信息,但在城市峡谷、隧道等复杂环境中,信号... 在缺乏全球定位系统(GPS)信号的环境中,仅依赖视觉惯性里程计的同步定位与建图(SLAM)算法虽能实现局部精确定位,但长距离移动时累积误差显著,导致定位精度下降。同时,尽管GPS能够提供全局位置信息,但在城市峡谷、隧道等复杂环境中,信号容易受到遮挡和干扰,导致定位性能不稳定,限制了其在复杂环境中的应用。为了解决上述问题,提出了VIG-SLAM算法,将视觉/惯导/轮速计紧耦合定位系统(VIW)与GPS数据进行自适应融合。首先,构建了GPS精度因子模型与异常检测机制,以评估并动态选择适合融合的高质量GPS数据。其次,提出了一种改进的自适应时间差补偿策略,解决GPS与VIW系统时间戳不匹配的问题,同时,在时间差补偿中动态调整GPS信号的权重,提升在复杂环境下的定位精度与鲁棒性。最后,构建了包含GPS约束的全局位姿图优化模型,将GPS全局定位信息作为全局约束,与VIW局部定位信息进行互补,实现大场景下的鲁棒定位。在公开数据集上以及真实实验场景中验证了所提方法的有效性,实验结果表明,相比当前主流视觉SLAM算法,提出的的VIG-SLAM算法平均定位精度至少提高15%,具有较强的鲁棒性和精度优势。 展开更多
关键词 SLAM GPS 位姿图优化 多传感器融合
原文传递
基于姿态-场景特征的视频异常检测研究
7
作者 陈志刚 张心宇 +1 位作者 刘凌枫 李航 《华中科技大学学报(自然科学版)》 北大核心 2025年第10期8-14,共7页
利用姿态骨骼点的低维和高度结构化特点,采用图卷积神经网络对姿态特征进行层次化和结构化处理,从个体姿态和个体之间的相互作用两方面进行分析;同时结合场景的丰富语义信息,引入条件变分自编码器进行异常检测.条件变分自编码器通过编... 利用姿态骨骼点的低维和高度结构化特点,采用图卷积神经网络对姿态特征进行层次化和结构化处理,从个体姿态和个体之间的相互作用两方面进行分析;同时结合场景的丰富语义信息,引入条件变分自编码器进行异常检测.条件变分自编码器通过编码场景图像和姿态特征映射,生成姿态-场景条件特征图,增强了场景特征与姿态特征的融合,提升了异常检测的准确性.该模型有效整合了姿态和场景特征,显著增强了在复杂环境下的异常行为检测能力.在上海科技、香港中文大学大道和西北工业大学校园三个异常检测数据集上,本文模型分别达到了84.3%,87.2%和69.7%的接收者操作特征曲线的曲线下面积(AUC)表现,展现了与现有技术相比的优越性. 展开更多
关键词 姿态估计 图卷积神经网络 条件变分自编码器 分层结构 视频异常检测
原文传递
基于时空图卷积网络与多层次特征融合的快递员3D人体姿态估计 被引量:1
8
作者 丁德波 史耀群 《传感技术学报》 北大核心 2025年第8期1457-1462,共6页
将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,... 将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,有效提取关节间的空间关系及时序依赖性。接着,通过引入多层次特征融合模块,融合来自不同网络层的特征信息,包括低层次的细节特征和高层次的抽象特征,从而更全面地捕捉快递员的人体关节动态变化和运动模式。为了验证所提方法的性能,在公开数据集Human3.6M上进行了实验。该数据集由视觉传感器采集得到,包含了丰富的人体姿态信息。仿真实验结果表明,所提出的方法能够显著提高三维姿态估计的精度。 展开更多
关键词 三维人体姿态估计 时空图卷积网络 多层次特征融合
在线阅读 下载PDF
联合多视图可控融合和关节相关性的三维人体姿态估计
9
作者 董婧 张鸿儒 +4 位作者 方小勇 周东生 杨鑫 张强 魏小鹏 《中国图象图形学报》 北大核心 2025年第1期254-267,共14页
目的多视图三维人体姿态估计能够从多方位的二维图像中估计出各个关节点的深度信息,克服单目三维人体姿态估计中因遮挡和深度模糊导致的不适定性问题,但如果系统性能被二维姿态估计结果的有效性所约束,则难以实现最终三维估计精度的进... 目的多视图三维人体姿态估计能够从多方位的二维图像中估计出各个关节点的深度信息,克服单目三维人体姿态估计中因遮挡和深度模糊导致的不适定性问题,但如果系统性能被二维姿态估计结果的有效性所约束,则难以实现最终三维估计精度的进一步提升。为此,提出了一种联合多视图可控融合和关节相关性的三维人体姿态估计算法CFJCNet(controlled fusion and joint correlation network),包括多视图融合优化模块、二维姿态细化模块和结构化三角剖分模块3部分。方法首先,基于极线几何框架的多视图可控融合优化模块有选择地利用极线几何原理提高二维热图的估计质量,并减少噪声引入;然后,基于图卷积与注意力机制联合学习的二维姿态细化方法以单视图中关节点之间的联系性为约束,更好地学习人体的整体和局部信息,优化二维姿态估计;最后,引入结构化三角剖分以获取人体骨长先验知识,嵌入三维重建过程,改进三维人体姿态的估计性能。结果该算法在两个公共数据集Human3.6M、Total Capture和一个合成数据集Occlusion-Person上进行了评估实验,平均关节误差为17.1 mm、18.7 mm和10.2 mm,明显优于现有的多视图三维人体姿态估计算法。结论本文提出了一个能够构建多视图间人体关节一致性联系以及各自视图中人体骨架内在拓扑约束的多视图三维人体姿态估计算法,优化二维估计结果,修正错误姿态,有效地提高了三维人体姿态估计的精确度,取得了最佳的估计结果。 展开更多
关键词 多视图 三维人体姿态估计 关节相关性 图卷积网络(GCN) 注意力机制 三角剖分
原文传递
基于AI动作捕捉技术的啦啦操训练中动作识别方法
10
作者 蔡晓菲 高夕 《上饶师范学院学报》 2025年第6期62-72,共11页
为全面捕捉啦啦操训练中的时空运动特征,课题组提出了一种基于人工智能(artificial intelligence,AI)动作捕捉技术的动作识别方法。首先,采用基于开放姿态(OpenPose)的人体姿态估计算法,从啦啦操训练视频中提取运动员的骨架序列,构建包... 为全面捕捉啦啦操训练中的时空运动特征,课题组提出了一种基于人工智能(artificial intelligence,AI)动作捕捉技术的动作识别方法。首先,采用基于开放姿态(OpenPose)的人体姿态估计算法,从啦啦操训练视频中提取运动员的骨架序列,构建包含全部关节的特征矩阵作为模型输入。其次,设计由运动引导空间图卷积模块与多尺度时间图卷积模块组成的时空图卷积网络。通过多层级联结构,同步捕捉啦啦操动作的空间拓扑特征(如关节间相对位置)和时间动态特征(如关节运动轨迹的时序变化)。最后,将六层时空图卷积处理结果依次输入最大池化层(降低空间维度)和全连接层,最终实现啦啦操动作类别的多分类预测。在标准啦啦操数据集上的测试结果表明:该方法可以准确识别啦啦操训练中的动作,F1分数(F1 score)达0.945;分类器鲁棒性优异,受试者工作特征(receiver operating characteristics,ROC)曲线下面积(area under curve,AUC)达0.896;实时性表现突出,每秒处理帧数(frames per second,FPS)达57帧/秒。通过引入运动引导拓扑图,基于人工智能动作捕捉技术的啦啦操训练中动作识别的方法显著增强了模型对运动关联性的建模能力,运动引导拓扑图的贡献度显著高于传统邻接矩阵图和学习矩阵图的贡献度,为复杂动作识别提供了新的解决方案。 展开更多
关键词 人工智能 动作捕捉技术 人体姿态估计算法 时空图卷积网络 运动引导拓扑图
在线阅读 下载PDF
联合多模态特征与结构感知的手物交互姿态估计
11
作者 王文润 党建武 +2 位作者 王阳萍 任鹏百 潘瑞 《光学精密工程》 北大核心 2025年第20期3265-3280,共16页
现实世界中手不可避免地要与物体进行交互,因此理解人手与物体的交互行为与意图具有重要的研究意义。本文针对手与物体交互过程中的相互遮挡、手部自遮挡及复杂交互背景等因素导致姿态估计精度低的问题,提出一种联合多模态特征与结构感... 现实世界中手不可避免地要与物体进行交互,因此理解人手与物体的交互行为与意图具有重要的研究意义。本文针对手与物体交互过程中的相互遮挡、手部自遮挡及复杂交互背景等因素导致姿态估计精度低的问题,提出一种联合多模态特征与结构感知的手部与交互物体三维姿态估计方法。该方法利用彩色图像和深度图像的多模态特征实现信息互补,有效解决背景复杂、手部自遮挡及手物相互遮挡的问题;其次,基于图结构分别设计手部、交互物体及手物交互结构感知模块,辅助估计更加合理和准确的手与交互物体的二维姿态;最后,将获取的二维姿态与深度图像中的深度信息进行合并,再利用纹理特征对合并得到的三维姿态进一步优化得到最终的手物交互三维姿态。为了验证本文方法的有效性,在FPHA,HO-3D等数据集开展了系列实验,手部和交互物体的姿态误差分别降低到9.62 mm和14.37 mm。实验结果表明,所提方法优于现有的手物交互姿态估计方法,具有较强的鲁棒性和泛化性。 展开更多
关键词 手物姿态估计 图卷积网络 多模态特征 结构感知
在线阅读 下载PDF
GMambaScanX:基于双流并行的三维人体姿态估计 被引量:1
12
作者 汤昊霖 袁煜麟 +3 位作者 卢笑 汪鲁才 吴成中 王耀南 《武汉大学学报(理学版)》 北大核心 2025年第4期463-472,共10页
基于Transformer的模型通过编码所有的关节点之间的连接关系,捕获全局视野的数据依赖关系,因而在三维人体姿态估计任务中取得了优秀性能。然而这类方法无法对关节局部依赖关系进行建模,且存在模型计算复杂度随序列长度平方增长的计算资... 基于Transformer的模型通过编码所有的关节点之间的连接关系,捕获全局视野的数据依赖关系,因而在三维人体姿态估计任务中取得了优秀性能。然而这类方法无法对关节局部依赖关系进行建模,且存在模型计算复杂度随序列长度平方增长的计算资源浪费问题。为了解决上述问题,本文将人体运动过程定义为状态空间模型的序列输入和输出过程,提出基于GCN(Graph Convolutional Network)和Mamba双流并行的人体结构扫描三维姿态估计方法GMambaScanX,GCN模型对人体运动序列时空邻接关系进行建模,增强模型的局部依赖关系捕获能力。Mamba模型对人体运动序列时空长程关系进行建模,增强模型的全局依赖关系捕获能力,提出两种MambaScan扫描策略,针对人体运动状态转移特征的时序关节扫描,增强模型在时间维度对人体运动特征的理解能力;针对人体关节结构特征的人体结构先验引导的空间关节扫描,增强模型在空间维度对人体结构特征的理解能力。GMambaScanX在Human3.6M数据集上进行训练验证,平均关节位置误差为39.8 mm,参数量仅为MotionBERT的12.4%(5.3×10^(6))。相比于进行全连接建模,GMambaScanX能够更好地提取人体结构特征,高效使用参数,提高模型的有效性与效率。 展开更多
关键词 三维人体姿态估计 状态空间模型 图卷积网络 人体结构关节点扫描
原文传递
基于位姿图优化的典型舱段三维重建与几何参数测量
13
作者 付文明 李小路 +1 位作者 胡彦平 周书涛 《强度与环境》 2025年第2期55-62,共8页
激光雷达三维重建技术对物体表面形貌进行精确测量,可用于舱段表面形变分析、舱段对接参数估计等场景,但由于点云配准累积误差存在,导致重建舱段存在畸变、错位等问题。本文针对舱段三维重建累积误差问题,提出了一种基于位姿图优化的典... 激光雷达三维重建技术对物体表面形貌进行精确测量,可用于舱段表面形变分析、舱段对接参数估计等场景,但由于点云配准累积误差存在,导致重建舱段存在畸变、错位等问题。本文针对舱段三维重建累积误差问题,提出了一种基于位姿图优化的典型舱段三维重建与几何参数测量方法。该方法首先通过点云配准计算邻帧点云的基础位姿变换矩阵,利用该矩阵形成初始化位姿图节点,然后在初始化位姿图中添加邻帧约束边,利用回环约束抑制累积误差,引入次邻帧约束增强对错误配准结果的鲁棒性。采用随机采样一致性方法测量三维重建舱段的半径和轴线;采用轴线投影法估计舱段长度。仿真结果表明,针对半径100 cm、长200 cm的圆柱形舱段,在点云分辨率为0.36 cm条件下,所提方法的三维重建倒角距离精度达0.97 cm,相比传统方法精度提升了53.59%;基于高精度三维成像仪开展了实测实验,结果表明所提方法几何参数估计误差不超过1.16%。 展开更多
关键词 位姿图优化 回环约束 三维重建 非接触式测量
在线阅读 下载PDF
自调节图卷积UNet的三维人体姿态估计方法 被引量:1
14
作者 马金林 崔琦磊 +2 位作者 马自萍 武江涛 曹浩杰 《北京航空航天大学学报》 北大核心 2025年第1期63-74,共12页
基于图卷积网络的三维人体姿态估计方法无法提取关节点的多尺度特征和未充分利用相邻节点的拓扑关系问题,提出自调节图卷积UNet的三维人体姿态估计方法M-Joint-UNet。M-Joint-UNet方法由Joint-UNet、自调节图卷积和融合损失3部分组成:Jo... 基于图卷积网络的三维人体姿态估计方法无法提取关节点的多尺度特征和未充分利用相邻节点的拓扑关系问题,提出自调节图卷积UNet的三维人体姿态估计方法M-Joint-UNet。M-Joint-UNet方法由Joint-UNet、自调节图卷积和融合损失3部分组成:Joint-UNet通过关节点池化与去池化改变特征图大小,以提取关节点的不同尺度特征;自调节图卷积通过可学习矩阵自动调节相邻节点或人体骨架结构的关系;使用L_(1)和L_(2)融合的损失缓解梯度爆炸。对比实验表明:所提方法在参数量和估计性能方面均获得了最优的结果,以Human3.6M的二维真实关节点作为输入的参数量仅为0.54×10^(6),MPJPE和P-MPJPE值分别为37.81 mm和30.21 mm。 展开更多
关键词 三维人体姿态估计 图卷积 Graph-UNet 关节点池化 权重矩阵
原文传递
基于图注意力机制的三维人体姿态估计时空上下文网络
15
作者 曾正东 赵明 《计算机应用》 北大核心 2025年第10期3161-3169,共9页
近期关于人体姿态估计的研究表明,充分发挥二维姿态潜在空间信息的能力,获取具有代表性的特征,可产生更准确的三维姿态估计结果。因此,提出一种基于图注意力机制的时空上下文网络,该网络包括带滑动窗口的时间上下文网络(TCN)、由肢体引... 近期关于人体姿态估计的研究表明,充分发挥二维姿态潜在空间信息的能力,获取具有代表性的特征,可产生更准确的三维姿态估计结果。因此,提出一种基于图注意力机制的时空上下文网络,该网络包括带滑动窗口的时间上下文网络(TCN)、由肢体引导的全局图注意力机制网络(EGAT)和基于姿态语法的局部图注意力卷积网络(PGCN)。首先,使用STCN将长序列的二维关节位置转化为单序列的人体姿态潜在特征,从而有效聚合和利用远、近距离的人体姿态信息,并大幅降低计算成本。其次,提出EGAT模块,以有效计算全局空间上下文。该模块将人体边缘节点视为“交通枢纽”,为它们与其他节点之间的信息交换建立桥梁。再次,利用图注意力机制进行自适应权值分配,对人体关节进行全局上下文计算。最后,设计PGCN模块,利用图卷积网络(GCN)计算和建模局部空间上下文,它强调人体对称节点的运动一致性和人体骨骼的运动关联结构。在Human3.6M和HumanEva-Ⅰ这2个复杂的标准数据集上评估所提模型。实验结果表明,所提模型具有更优越的性能,在输入帧长度为81的情况下,所提模型在数据集Human3.6M上的每个关节的平均位置误差(MPJPE)达43.5 mm,与目前先进算法MCFNet(Multi-scale Cross Fusion Network)相比降低了10.5%,体现出更高的准确度。 展开更多
关键词 三维人体姿态估计 图注意力 时间上下文 空间上下文 时间卷积网络
在线阅读 下载PDF
面向配电网带电作业的轻量化人体姿态估计安全识别研究 被引量:1
16
作者 刘凯 赵慧敏 +4 位作者 吴田 吴晨 万亚旭 李晶 聂伟 《安全与环境学报》 北大核心 2025年第9期3445-3455,共11页
带电作业是电力系统维护和运行中的关键环节,其安全性直接影响到人员的生命安全和设备的可靠性。针对目前配电网带电作业安全监控实时性差、人员行为识别不准确等问题,提出了一种基于轻量化人体姿态估计的配电网带电作业安全监控方法。... 带电作业是电力系统维护和运行中的关键环节,其安全性直接影响到人员的生命安全和设备的可靠性。针对目前配电网带电作业安全监控实时性差、人员行为识别不准确等问题,提出了一种基于轻量化人体姿态估计的配电网带电作业安全监控方法。首先,通过YOLOv8n-Pose模型对带电作业人员同时进行目标检测和人体姿态估计,并引入自适应轻量级自监督(Adaptive Lightweight Self-Supervised,ALSS)模块作为骨干网,优化内存访问以最小化冗余操作并提高速度,同时在空间金字塔快速池化(Spatial Pyramid Pooling-Fast,SPPF)模块加入注意力机制,增强模型对于不同尺度作业人员的池化能力,提升检测精度。其次,通过调整形状损失来改进软交并比(Soft Intersection over Union,SIOU)的损失函数以提升定位精度。最后,由时空图卷积网络(Spatial Temporal Graph Convolutional Networks,ST-GCN)提取时空图的空间姿态与时序信息,运用构建的配电网带电作业数据集进行试验,通过行为分类完成带电作业行为识别。结果表明,该模型在mAP@0.5提升3.4百分点的情况下,模型参数量和计算量分别降低50.5%和51.6%,ST-GCN能有效识别带电作业行为,平均准确率达88.0%,并且最终在Jetson XAVIER NX边缘计算机上顺利完成视频流检测任务测试。 展开更多
关键词 安全工程 姿态估计 YOLOv8n-Pose 时空图卷积网络 安全监护 边缘端
原文传递
基于改进AlphaPose的人体特征行为识别方法及应用
17
作者 董贇 张希翔 +3 位作者 艾徐华 银源 宁梓宏 李自品 《武汉大学学报(工学版)》 北大核心 2025年第11期1767-1775,共9页
结合电网巡检人员过程评价和监管的实际需求,针对人体行为复杂多变且检测目标尺度差异大等问题,提出一种基于改进AlphaPose的人体特征行为识别方法。该方法首先设计一种分阶段多尺度目标检测网络(改进SRCNN(super-resolution convolutio... 结合电网巡检人员过程评价和监管的实际需求,针对人体行为复杂多变且检测目标尺度差异大等问题,提出一种基于改进AlphaPose的人体特征行为识别方法。该方法首先设计一种分阶段多尺度目标检测网络(改进SRCNN(super-resolution convolutional neural network)+ScaledNet);然后用分阶段多尺度目标检测网络代替AlphaPose中的目标检测模块,并引入参数化姿态非极大值抑制算法,以提高人体姿态估计的速度和精度;最后利用改进人体姿态估计网络(分阶段多尺度目标检测网络+SPPE(single-person pose estimator))进行人体姿态估计获取人体关节点序列图,并设计一种时空图卷积行为识别网络对人体特征行为进行识别。测试结果表明,所设计的分阶段多尺度目标检测网络的精度和速度分别达到90.85%和42.7帧/s;改进的人体姿态估计网络的精度和速度分别达到80.5%和20.3帧/s。应用案例表明,该方法对巡检人员特征行为识别的平均准确率高达94.75%。该方法可广泛应用于电力巡检或其他场景人员作业过程监管等领域。 展开更多
关键词 特征行为识别 多尺度目标检测 人体姿态估计 时空图卷积 巡检过程监管
原文传递
GNSS拒止环境下基于共视图优化的无人机影像快速位姿估计与应急建图
18
作者 辜第桢 杨耘 +5 位作者 赵波 李祖锋 郝国朴 陈世昌 杨成生 唐一亮 《地球科学与环境学报》 北大核心 2025年第5期987-998,共12页
针对全球导航卫星系统(GNSS)拒止环境下无人机影像位姿估计效率低的问题,提出一种基于共视图优化的快速建图算法——NSG-VLAD算法。首先,利用尺度不变特征变换(SIFT)提取每张影像的特征,并利用局部聚合描述子向量(VLAD)算法将特征描述... 针对全球导航卫星系统(GNSS)拒止环境下无人机影像位姿估计效率低的问题,提出一种基于共视图优化的快速建图算法——NSG-VLAD算法。首先,利用尺度不变特征变换(SIFT)提取每张影像的特征,并利用局部聚合描述子向量(VLAD)算法将特征描述子聚合为全局特征向量;其次,利用基于图索引的近似最近邻搜索(ANNS)算法进行相似影像的检索;最后,对各个相似影像对构建共视图,并进行迭代匹配,从而提升影像特征匹配、影像位姿估计及应急场景建图的效率。在此基础上,利用NPU_FACTORY、NPU_PARK数据集以及3个自制数据集,将NSG-VLAD算法与具有代表性的Colmap开源软件和Metashape、Pix4Dmapper商业软件进行对比验证。结果表明:NSG-VLAD算法较Metashape商业软件重建速度提高了3倍,比Colmap开源软件快10倍以上,重投影误差优于Colmap开源软件和Metashape商业软件;在应急测绘任务下的三维点云建图速度高于同类方法至少2倍,验证了NSG-VLAD算法在地震灾害等GNSS拒止环境下的应急测绘中具有良好应用前景。 展开更多
关键词 无人机影像序列 应急场景 影像检索 共视图 特征匹配 位姿估计 运动恢复结构
在线阅读 下载PDF
基于回环边残差聚焦权重模型的位姿图优化算法
19
作者 冒凡 魏国亮 +2 位作者 蔡洁 郑劲康 简单 《计算机应用研究》 北大核心 2025年第1期149-155,共7页
基于图优化的同时定位与建图(SLAM)系统中含有大噪声的回环边,可能严重阻碍优化器迅速收敛到最优解,显著降低定位精确性和地图一致性。因此,针对大噪声回环边的优化算法的鲁棒性至关重要。引入K-means聚类思想,对回环边残差值进行分类,... 基于图优化的同时定位与建图(SLAM)系统中含有大噪声的回环边,可能严重阻碍优化器迅速收敛到最优解,显著降低定位精确性和地图一致性。因此,针对大噪声回环边的优化算法的鲁棒性至关重要。引入K-means聚类思想,对回环边残差值进行分类,进而建立了一种新的残差阈值模型,自适应调整回环边在优化时的权重,减少回环边对优化的影响;然后,基于迭代重加权最小二乘的思想形成了RW-RLSPGO算法(residual weighted enhancement for recursive least squares pose graph optimization algorithm,RWRLSPGO);最后,在模拟和真实的PGO数据集上进行蒙特卡罗实验。实验结果表明,RW-RLSPGO算法在准确性和鲁棒性方面都取得了显著的提高,验证了其在大噪声环境下的有效性。 展开更多
关键词 同时定位与建图 位姿图优化 回环边 大噪声 聚类
在线阅读 下载PDF
多级图特征融合引导相机位姿回归
20
作者 司钧文 周自维 《光学精密工程》 北大核心 2025年第6期928-944,共17页
为了提高复杂场景下相机位姿估计的精度和稳定性,本文自主设计了ResGraphLoc网络,该网络通过引入残差网络与图注意力机制,进一步提高相机在遮挡、光照变化和低纹理场景下的位姿回归精度问题。该网络采用ResNet101作为特征编码器,通过改... 为了提高复杂场景下相机位姿估计的精度和稳定性,本文自主设计了ResGraphLoc网络,该网络通过引入残差网络与图注意力机制,进一步提高相机在遮挡、光照变化和低纹理场景下的位姿回归精度问题。该网络采用ResNet101作为特征编码器,通过改进的残差块增强显著特征提取能力。利用图注意力层融合多级特征图,并通过多头自注意力机制实现特征信息扩散和聚合。最后,通过非线性MLP层从特征嵌入中提取位置和角度特征,完成端到端相机位姿回归。在大型室外数据集上,ResGraphLoc模型的位姿误差优于现有算法。在LOOP和FULL场景下,位姿回归结果分别为7.18 m,2.48°与16.96 m,3.16°,相比基准模型提升超过25%。在4Seasons数据集的Neighborhood场景下,室外定位误差最低可以达到1.40 m,0.76°。在纹理缺失及重复的室内数据集下,位置角度回归结果分别可以达到0.08 m,3.25°。实验结果验证了ResGraphLoc在复杂环境下的高精度和稳定性,能有效应对遮挡、光照变化和低纹理场景。 展开更多
关键词 计算机视觉 相机位姿回归 相机定位 图注意力 多级特征融合
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部