Dear Editor,Pose graph optimization(PGO)is a popular optimization approach that plays a crucial role in the simultaneous localization and mapping(SLAM)back-end.However,when incorrect loop closure constraints(referred ...Dear Editor,Pose graph optimization(PGO)is a popular optimization approach that plays a crucial role in the simultaneous localization and mapping(SLAM)back-end.However,when incorrect loop closure constraints(referred to as outliers)are present in the SLAM front-end,the standard PGO algorithm fails catastrophically and can not return an accurate map.To address this issue,this letter proposes a novel algorithm that leverages classical optimization methods to effectively handle outliers.The proposed algorithm introduces a new formulation that incorporates a credibility factor model,which improves the robustness of the optimization process.Additionally,an innovative consistency classification algorithm is developed to detect outliers.Extensive experiments are conducted on multiple benchmark datasets to evaluate the consistency and accuracy of the proposed algorithm.展开更多
现有人体姿态动作识别方法忽视前期姿态估计算法的作用,没有充分提取动作特征,提出一种结合轻量级Openpose和注意力引导图卷积网络的动作识别方法。该方法包含基于shufflenet的Openpose算法和基于不同尺度邻接矩阵注意力的图卷积算法。...现有人体姿态动作识别方法忽视前期姿态估计算法的作用,没有充分提取动作特征,提出一种结合轻量级Openpose和注意力引导图卷积网络的动作识别方法。该方法包含基于shufflenet的Openpose算法和基于不同尺度邻接矩阵注意力的图卷积算法。输入视频由轻量Openpose处理得到18个人体关键点信息,表达为基础时空图数据形式。节点的不同尺度邻居信息对应的邻接矩阵通过自注意力机制计算影响力,将各尺度邻接矩阵加权合并输入图卷积网络提取特征。提取到的鉴别特征通过全局平均池化和softmax分类器输出动作类别。在Le2i Fall Detection数据集和自定义的UR-KTH数据集上的实验表明,动作识别的准确率分别为95.52%和95.07%,达到了预期效果。展开更多
为全面捕捉啦啦操训练中的时空运动特征,课题组提出了一种基于人工智能(artificial intelligence,AI)动作捕捉技术的动作识别方法。首先,采用基于开放姿态(OpenPose)的人体姿态估计算法,从啦啦操训练视频中提取运动员的骨架序列,构建包...为全面捕捉啦啦操训练中的时空运动特征,课题组提出了一种基于人工智能(artificial intelligence,AI)动作捕捉技术的动作识别方法。首先,采用基于开放姿态(OpenPose)的人体姿态估计算法,从啦啦操训练视频中提取运动员的骨架序列,构建包含全部关节的特征矩阵作为模型输入。其次,设计由运动引导空间图卷积模块与多尺度时间图卷积模块组成的时空图卷积网络。通过多层级联结构,同步捕捉啦啦操动作的空间拓扑特征(如关节间相对位置)和时间动态特征(如关节运动轨迹的时序变化)。最后,将六层时空图卷积处理结果依次输入最大池化层(降低空间维度)和全连接层,最终实现啦啦操动作类别的多分类预测。在标准啦啦操数据集上的测试结果表明:该方法可以准确识别啦啦操训练中的动作,F1分数(F1 score)达0.945;分类器鲁棒性优异,受试者工作特征(receiver operating characteristics,ROC)曲线下面积(area under curve,AUC)达0.896;实时性表现突出,每秒处理帧数(frames per second,FPS)达57帧/秒。通过引入运动引导拓扑图,基于人工智能动作捕捉技术的啦啦操训练中动作识别的方法显著增强了模型对运动关联性的建模能力,运动引导拓扑图的贡献度显著高于传统邻接矩阵图和学习矩阵图的贡献度,为复杂动作识别提供了新的解决方案。展开更多
基金supported in part by the National Nature Science Foundation of China(62273239,62103283).
文摘Dear Editor,Pose graph optimization(PGO)is a popular optimization approach that plays a crucial role in the simultaneous localization and mapping(SLAM)back-end.However,when incorrect loop closure constraints(referred to as outliers)are present in the SLAM front-end,the standard PGO algorithm fails catastrophically and can not return an accurate map.To address this issue,this letter proposes a novel algorithm that leverages classical optimization methods to effectively handle outliers.The proposed algorithm introduces a new formulation that incorporates a credibility factor model,which improves the robustness of the optimization process.Additionally,an innovative consistency classification algorithm is developed to detect outliers.Extensive experiments are conducted on multiple benchmark datasets to evaluate the consistency and accuracy of the proposed algorithm.
文摘现有人体姿态动作识别方法忽视前期姿态估计算法的作用,没有充分提取动作特征,提出一种结合轻量级Openpose和注意力引导图卷积网络的动作识别方法。该方法包含基于shufflenet的Openpose算法和基于不同尺度邻接矩阵注意力的图卷积算法。输入视频由轻量Openpose处理得到18个人体关键点信息,表达为基础时空图数据形式。节点的不同尺度邻居信息对应的邻接矩阵通过自注意力机制计算影响力,将各尺度邻接矩阵加权合并输入图卷积网络提取特征。提取到的鉴别特征通过全局平均池化和softmax分类器输出动作类别。在Le2i Fall Detection数据集和自定义的UR-KTH数据集上的实验表明,动作识别的准确率分别为95.52%和95.07%,达到了预期效果。
文摘为全面捕捉啦啦操训练中的时空运动特征,课题组提出了一种基于人工智能(artificial intelligence,AI)动作捕捉技术的动作识别方法。首先,采用基于开放姿态(OpenPose)的人体姿态估计算法,从啦啦操训练视频中提取运动员的骨架序列,构建包含全部关节的特征矩阵作为模型输入。其次,设计由运动引导空间图卷积模块与多尺度时间图卷积模块组成的时空图卷积网络。通过多层级联结构,同步捕捉啦啦操动作的空间拓扑特征(如关节间相对位置)和时间动态特征(如关节运动轨迹的时序变化)。最后,将六层时空图卷积处理结果依次输入最大池化层(降低空间维度)和全连接层,最终实现啦啦操动作类别的多分类预测。在标准啦啦操数据集上的测试结果表明:该方法可以准确识别啦啦操训练中的动作,F1分数(F1 score)达0.945;分类器鲁棒性优异,受试者工作特征(receiver operating characteristics,ROC)曲线下面积(area under curve,AUC)达0.896;实时性表现突出,每秒处理帧数(frames per second,FPS)达57帧/秒。通过引入运动引导拓扑图,基于人工智能动作捕捉技术的啦啦操训练中动作识别的方法显著增强了模型对运动关联性的建模能力,运动引导拓扑图的贡献度显著高于传统邻接矩阵图和学习矩阵图的贡献度,为复杂动作识别提供了新的解决方案。