期刊文献+
共找到369篇文章
< 1 2 19 >
每页显示 20 50 100
融合双层语义信息的3维人体姿态估计网络
1
作者 贾迪 杨柳 +1 位作者 徐驰 何德堃 《机器人》 北大核心 2026年第1期55-65,共11页
在融合人体姿态的多个可行解时现有方法没有充分学习假设间的依赖关系,易导致融合结果精度不高。为此,提出了一种融合双层语义信息的3维人体姿态估计网络。首先,提出一种层次特征提取模块,对人体关节点的内在结构信息进行建模,提取包含... 在融合人体姿态的多个可行解时现有方法没有充分学习假设间的依赖关系,易导致融合结果精度不高。为此,提出了一种融合双层语义信息的3维人体姿态估计网络。首先,提出一种层次特征提取模块,对人体关节点的内在结构信息进行建模,提取包含不同层次语义信息的假设特征,同时提高关节点位置信息的利用率;其次,为进一步提高网络性能,设计特征细化模块对假设特征进行自我信息传递,以增强关节点间位置的关联性;最后,提出一种层次特征融合模块及关联计算子模块,学习多假设特征间的依赖关系,并根据该关系在假设特征间进行跨假设信息传递,使其融合为一个精准的假设特征,以此充分利用不同假设的不同层次语义信息来获得最终的3维人体姿态估计结果。分别在Human3.6M、MPI-INF-3DHP以及HumanEva-I数据集上验证所提模型的表现,实验结果表明,本方法能提高3维人体姿态估计的准确性,且可有效应对人物自遮挡及姿势复杂等情况。 展开更多
关键词 3维人体姿态估计 多假设融合 层次特征提取 特征细化
原文传递
基于多模态数据融合的康复机器人关节角度预测方法
2
作者 陈博 王斌 +3 位作者 周袁 周京 王浙明 叶祥明 《控制与决策》 北大核心 2026年第3期604-612,共9页
在人体关节角度预测中,单传感器获取信息太过局限且易受环境干扰影响,而基于多传感器的关节角度的预测研究,由于输入数据维度升高、传统的融合方式存在特征利用率不足的缺陷,导致预测精度下降.为准确获取运动功能障碍患者佩戴外骨骼康... 在人体关节角度预测中,单传感器获取信息太过局限且易受环境干扰影响,而基于多传感器的关节角度的预测研究,由于输入数据维度升高、传统的融合方式存在特征利用率不足的缺陷,导致预测精度下降.为准确获取运动功能障碍患者佩戴外骨骼康复过程中的运动状态,提出基于多模态数据融合的康复机器人关节角度预测方法.首先,设计多通道高分辨率网络结构使其适用于人体3维姿态特征提取任务,同时利用卷积神经网络提取足底压力特征;其次,基于长短期记忆网络获取特征在时域上的关联性;然后,构建带注意力机制的多模态特征融合网络用于人体关节角度预测;最后,通过在低、中、高3组速度下的实验结果表明:所提出算法在自建数据集上的评价指标RMSE为0.039,较传统关节角度预测方法提升38%以上;评价指标R2为0.948,较传统关节角度预测方法提升17%以上. 展开更多
关键词 康复机器人 关节角度预测 人体姿态估计 多通道高分辨率网络 长短期记忆网络 多模态特征融合网络
原文传递
基于 ControlNet 实现人脸多姿态实验设计
3
作者 庞孟 肖敏华 +2 位作者 周崟涛 王炜立 曾勍炜 《实验室研究与探索》 北大核心 2026年第3期109-114,共6页
为解决生成式人工智能教学案例匮乏、学生难以直观理解深度生成模型控制机制的问题,设计并实现了一项基于ControlNet模型的人脸多姿态生成教学实验。实验以预训练的Stable Diffusion为基础框架,引入可训练的ControlNet分支实现姿态控制... 为解决生成式人工智能教学案例匮乏、学生难以直观理解深度生成模型控制机制的问题,设计并实现了一项基于ControlNet模型的人脸多姿态生成教学实验。实验以预训练的Stable Diffusion为基础框架,引入可训练的ControlNet分支实现姿态控制,通过提示词(Prompt)调节人脸方向变化。利用Python编程语言与生成式AI开发库(如Diffusers)构建可视化、可交互的教学实验系统。基于Multi-PIE和LAMP-HQ数据集的实验结果表明,该系统在姿态控制精度与身份保持方面表现良好。该实验有助于学生理解条件生成机制,提升实践与创新能力,为生成式人工智能实验教学提供可复用的参考范例。 展开更多
关键词 生成式人工智能 CONTROLNET 人脸多姿态 教学实验设计
在线阅读 下载PDF
基于多特征融合的果园无人机位姿估计方法
4
作者 刘旭航 褚子龙 +2 位作者 赵红利 于嘉辉 韩文霆 《农业机械学报》 北大核心 2026年第4期1-9,共9页
为解决果园环境中冠层遮挡和特征重复导致果园无人机位姿估计系统无法正常工作的问题,本文利用视觉惯性里程计技术,结合点特征与线特征几何约束,设计一种多特征融合的果园无人机位姿估计方法。利用EDLines算法取代传统的LSD算法提取图... 为解决果园环境中冠层遮挡和特征重复导致果园无人机位姿估计系统无法正常工作的问题,本文利用视觉惯性里程计技术,结合点特征与线特征几何约束,设计一种多特征融合的果园无人机位姿估计方法。利用EDLines算法取代传统的LSD算法提取图像中的线特征,通过光流法实现特征点与特征线在连续帧间的快速跟踪与匹配,并进行三维特征重建得到特征位姿。构建基于非线性优化的位姿估计模型融合惯性信息与视觉信息,在局部滑动窗口内,构造联合最小化的全局代价函数,通过求解该函数完成准确的位姿估计。选取结果期苹果园以及葡萄温室进行试验,以绝对轨迹误差和相对轨迹误差作为评价指标,验证所设计位姿估计方法性能。试验结果表明,相较于利用LSD算法提取线特征的传统位姿估计方法,所设计方法绝对轨迹误差平均值降低10%,相对轨迹误差平均值降低27%,有效提高了果园无人机导航系统精度和鲁棒性,为保障果园无人机作业安全性提供了可靠支撑。 展开更多
关键词 视觉惯性里程计 多特征融合 果园无人机 位姿估计 多传感器融合
在线阅读 下载PDF
复杂水域下的声呐-视觉-惯性紧耦合位姿估计方法
5
作者 周卫东 毛梓恒 +2 位作者 徐博 张广拓 张晓宇 《中国惯性技术学报》 北大核心 2026年第1期16-24,共9页
针对光照不足与噪声干扰导致水下位姿估计精度严重下降的问题,提出了一种基于声呐、视觉与惯性传感器融合的水下多模态位姿估计方法。首先,采用自适应直方图均衡化与多尺度颜色恢复相结合的算法,为系统特征提取提供高质量图像数据;其次... 针对光照不足与噪声干扰导致水下位姿估计精度严重下降的问题,提出了一种基于声呐、视觉与惯性传感器融合的水下多模态位姿估计方法。首先,采用自适应直方图均衡化与多尺度颜色恢复相结合的算法,为系统特征提取提供高质量图像数据;其次,对惯性测量单元(IMU)数据进行预积分,将其转换为相对运动约束,以减少后端优化计算量;然后,将视觉重投影误差、IMU测量误差以及声呐距离测量误差作为约束,构建紧耦合优化模型,提升水下机器人位姿估计精度。在EuRoC数据集与AFRL水下数据集上的实验表明:在常规水下环境中,所提方法的定位精度与主流视觉惯性方法相当;而在高浊度与多回环水下环境中,其定位精度较OKVIS分别提升了78.72%和54.97%,验证了所提方法在复杂水域具有更高的定位精度与鲁棒性。 展开更多
关键词 水下位姿估计 声呐 多传感器融合 水下机器人
在线阅读 下载PDF
PKHOI:利用先验知识增强人-物交互检测算法
6
作者 赵文豪 梅萌 +1 位作者 王小平 罗航宇 《计算机科学》 北大核心 2026年第1期141-152,共12页
人-物交互检测(Human-Object Interaction,HOI)在视觉场景理解中起着至关重要的作用,随着深度学习技术的发展,基于视觉的交互检测模型已经能够获得良好的性能。然而,现有方法大多缺乏对先验的逻辑知识的运用,有时会推导出不合理的结果... 人-物交互检测(Human-Object Interaction,HOI)在视觉场景理解中起着至关重要的作用,随着深度学习技术的发展,基于视觉的交互检测模型已经能够获得良好的性能。然而,现有方法大多缺乏对先验的逻辑知识的运用,有时会推导出不合理的结果。其次,一些方法将空间信息和人体姿态信息用于推理,但它们仅在推理结果和标注之间构造损失,导致解码器无法学习到准确的隐含关系。因此,提出一种利用先验知识增强现有人-物交互检测算法的方法PKHOI,该方法能够有效增强现有人-物交互检测算法的准确性。具体而言,从训练集中构建了一个包含物品功能性、空间关系、人体姿态和动词共现的逻辑规则表,将其形式化为一阶逻辑并映射到连续空间中,在训练阶段和推理阶段分别以损失函数和矩阵乘法的形式将先验的逻辑规则融入神经网络,提升模型的准确性。此外,提出一种通过融合多模态信息(空间、语义和人体姿态信息)生成人-物对查询的方法,结合逻辑损失函数,可以引导解码器学习到更多的隐含知识。利用提出的方法增强了两个主流的人-物交互检测算法UPT和PViC,并在V-COCO,HICO-DET和Flickr30k数据集上进行了评估,实验结果表明,提出的方法可以有效提高现有方法的性能。 展开更多
关键词 人-物交互检测 先验知识 一阶逻辑 姿态信息 多模态信息融合
在线阅读 下载PDF
无人机引导下多消防机器人协同作业
7
作者 华长春 穆殿瑞 +1 位作者 陈健楠 魏饶 《自动化学报》 北大核心 2026年第2期267-283,共17页
复杂火灾场景下传统消防手段存在全局感知能力不足、协同能力弱等问题,因此提出一种基于无人机空中引导的多消防机器人协同作业系统.通过构建空-地异构协同架构,融合无人机全局态势感知与地面消防机器人精准作业能力,实现火灾动态环境... 复杂火灾场景下传统消防手段存在全局感知能力不足、协同能力弱等问题,因此提出一种基于无人机空中引导的多消防机器人协同作业系统.通过构建空-地异构协同架构,融合无人机全局态势感知与地面消防机器人精准作业能力,实现火灾动态环境下的高效协同灭火.通过融合先验地图、高空侦察信息和多视角观测信息,构建适用于灭火指控的多图层火场地图,在保障关键信息获取的同时兼顾建图效率.同时结合水柱轨迹模型、多视角观测信息及结构层数据,实现水柱轨迹和落点的准确检测.然后设计队列式与多形态主从编队模式,配合快速队形重构算法生成编队参考信号.进而,基于提出的柔性预定性能函数设计无人机位姿矢量控制器,以及基于改进视距导引法设计多消防机器人编队控制器.最后,开展空-地多机协同控制算法的仿真验证,并将系统集成到开诚RXB-MC80BD消防机器人上进行应用测试. 展开更多
关键词 多图层火场建图 柔性预定性能控制 无人机位姿矢量控制 消防机器人多模态编队
在线阅读 下载PDF
大型回转体部件对接位姿测量方法
8
作者 辛成龙 周江 +1 位作者 宫久路 王泽鹏 《探测与控制学报》 北大核心 2026年第1期107-114,共8页
针对大型回转体部件自动对接过程中,位姿参数难以测量的问题,提出一种用于大型回转体部件对接的位姿测量方法。该方法以测量对象几何特性、测量需求、测量场景为约束,设计视觉测量系统;基于成像特征的几何特性,设计了一种两阶段的特征... 针对大型回转体部件自动对接过程中,位姿参数难以测量的问题,提出一种用于大型回转体部件对接的位姿测量方法。该方法以测量对象几何特性、测量需求、测量场景为约束,设计视觉测量系统;基于成像特征的几何特性,设计了一种两阶段的特征提取算法,解决了特征检测速度慢、精度低的问题;在此基础上,基于多相机位姿约束和空间圆成像特性,提出一种基于特征补全的位姿估计算法,实现了位姿参数的准确测量。实验结果表明,目标的位置参数测量误差均值小于2 mm,姿态参数测量误差均值小于0.05°,算法具有较好的测量精度和鲁棒性,可以满足自动对接的需求。 展开更多
关键词 大型回转体部件 多相机约束 单目视觉 位姿测量
在线阅读 下载PDF
基于多视角融合的机器人抓取位姿估计模型
9
作者 杨红玲 代路 解仑 《科学技术与工程》 北大核心 2026年第9期3616-3625,共10页
为解决机械臂抓取时因物体对称性和遮挡等因素引发的位姿估计难题,通过融合多视角RGB-D数据的方法研究了目标物体的六自由度位姿估计问题。该方法基于单视角位姿估计框架,利用三维关键点投票网络对各视角场景中的三维关键点进行独立预测... 为解决机械臂抓取时因物体对称性和遮挡等因素引发的位姿估计难题,通过融合多视角RGB-D数据的方法研究了目标物体的六自由度位姿估计问题。该方法基于单视角位姿估计框架,利用三维关键点投票网络对各视角场景中的三维关键点进行独立预测,并通过置信度评分、加权融合以及均值偏移聚类实现多视角信息的有效整合,最终完成目标物体位姿的精确求解。结果表明:该方法在对称与遮挡场景下能够显著提升位姿估计精度;多视角融合策略有效增强了关键点的预测稳定性与鲁棒性;在桌面环境下的自主抓取实验中显著提高了抓取成功率与执行效果。实验证明,所提出的方法在复杂抓取场景中具有良好的适应性和应用价值,能有效提高在非结构化场景下的作业自主性,还为解决复杂工况下的智能装配作业提供了关键技术支撑,具有广阔的产业应用前景。 展开更多
关键词 场景融合 位姿估计 均值偏移 关键点 多视角 机器人抓取
在线阅读 下载PDF
基于多机器人协同的模拟装配位姿高精度构建技术
10
作者 万舒彪 沈义平 +4 位作者 卜星 徐爱杰 洪海波 王元耿 何军 《制造技术与机床》 北大核心 2026年第4期103-112,共10页
增压输送管路作为运载火箭系统主体部件,承载推进剂从贮箱稳定输送至发动机的功能作用,直接关系运载火箭飞行可靠性。为解决复杂管路异地装配繁琐、反复测量难等问题,提出了一种利用双目跟踪仪结合视觉靶标的方法实现了机器人在管路装... 增压输送管路作为运载火箭系统主体部件,承载推进剂从贮箱稳定输送至发动机的功能作用,直接关系运载火箭飞行可靠性。为解决复杂管路异地装配繁琐、反复测量难等问题,提出了一种利用双目跟踪仪结合视觉靶标的方法实现了机器人在管路装配中的高精度位姿复现。利用工业机器人和双目跟踪视觉系统进行多次重复实验,首先构建坐标系并进行对齐映射,其次采用基于视觉的多机器人闭环控制算法进行实时的位置校正,最后通过机器人现场位姿复现实验验证方法的有效性。结果表明,在动态跟踪过程中最大误差达0.01 mm,平均误差仅为0.007 mm,显示出良好的实时性和定位精度。该研究方法在复杂管路拼装领域具有实际应用价值。 展开更多
关键词 双目跟踪 多机器人协同 坐标系构建 定位补偿 位姿复现
在线阅读 下载PDF
基于单目姿态估计的行人碰撞损伤评估研究
11
作者 王美军 孟宇 +2 位作者 郑超 彭晓睿 许焱 《汽车安全与节能学报》 北大核心 2026年第1期33-39,共7页
为实现交通事故中行人应急姿态的量化损伤评估,该文提出一种基于单目姿态估计的车前行人碰撞损伤评估方法。利用姿态估计算法,从单视角事故图像中提取姿态参数,并通过关节匹配将蒙皮多人线性(SMPL)模型映射至多刚体模型,实现应急姿态的... 为实现交通事故中行人应急姿态的量化损伤评估,该文提出一种基于单目姿态估计的车前行人碰撞损伤评估方法。利用姿态估计算法,从单视角事故图像中提取姿态参数,并通过关节匹配将蒙皮多人线性(SMPL)模型映射至多刚体模型,实现应急姿态的快速重建;结合MADYMO仿真软件,对站立、前倾、下蹲和跑步避让4种典型姿态开展股骨损伤的碰撞仿真。结果表明:该方法在仿真精度上与人工建模一致,4类姿态下的AIS2+与AIS3+损伤风险概率平均差值分别低至-3.5%和-1.22%;该方法提升了姿态建模的自动化与复现性,可为车辆结构优化和行人保护设计提供定量化参考。 展开更多
关键词 应急姿态 姿态估计 蒙皮多人线性(SMPL)模型 多刚体模型 损伤评估
在线阅读 下载PDF
基于改进PSO算法的多维振动铸件分拣平台设计与调姿优化
12
作者 李康康 王智慧 +3 位作者 朱梓豪 王成军 尹豪宇 郑艳 《机械强度》 北大核心 2026年第3期68-76,共9页
【目的】针对传统铸件分拣平台运动自由度受限及调姿精度不足的问题,设计一种多维振动调姿平台并提出相应的优化算法。【方法】首先,研发了一种具有拨动机构的创新结构,并引入多维振动激励模块以实现铸件位姿调整;其次,提出了一种自适... 【目的】针对传统铸件分拣平台运动自由度受限及调姿精度不足的问题,设计一种多维振动调姿平台并提出相应的优化算法。【方法】首先,研发了一种具有拨动机构的创新结构,并引入多维振动激励模块以实现铸件位姿调整;其次,提出了一种自适应动态调整权重的改进粒子群优化(Improved Particle Swarm Optimization, IMPSO)算法,通过引入自适应干扰力和动态权重机制,提升了算法的收敛性能;再次,建立了以位置和姿态偏差为目标的适应度函数,通过Matlab软件仿真对比了IMPSO算法与粒子群优化(Particle Swarm Optimization, PSO)、遗传粒子群优化(Genetic Algorithm-Particle Swarm Optimization, GA-PSO)、混沌粒子群优化(Chaotic Particle Swarm Optimization, CPSO)算法的性能;最后,搭建了样机试验平台进行实测验证。【结果】仿真结果表明,相比于传统算法,IMPSO算法的迭代收敛速度提升了10%~27%;样机试验显示,平台对铸件的位置与姿态调整最大偏差分别控制在0.396 74 cm与0.244 13°以内,能够满足复杂工业场景下的高精度柔性分拣需求。 展开更多
关键词 多维振动 拨动机构 自适应权重 调姿 分拣
在线阅读 下载PDF
多维传感数据下运动姿态特征捕捉
13
作者 马宏春 闫辉 +1 位作者 李梅 焦国强 《计算机仿真》 2026年第2期514-519,共6页
当前动作捕捉系统通过结合光学球形标识物与摄像机,利用陀螺仪解算运动姿态估计来实现动作捕捉。不过,磁干扰耦合会使横滚和俯仰姿态解算产生误差,导致尺度基准模糊,位姿计算误差累积,影响在三维空间精确捕捉物体运动姿态。为此,提出一... 当前动作捕捉系统通过结合光学球形标识物与摄像机,利用陀螺仪解算运动姿态估计来实现动作捕捉。不过,磁干扰耦合会使横滚和俯仰姿态解算产生误差,导致尺度基准模糊,位姿计算误差累积,影响在三维空间精确捕捉物体运动姿态。为此,提出一种基于多维传感数据的运动姿态特征捕捉方法。利用多维传感器采集数据,通过PCA(主分量分析)对多维传感器信号进行降维。构建目标对象的运动状态空间模型,此模型能全面描述物体运动状态,并分析目标对象运动角度的动态变化规律,有助于在复杂磁干扰环境中更好地理解物体姿态变化,进而减少姿态解算误差。设定运动姿态坐标系统与边界,算出运动姿态速度约束条件,有效解决因磁干扰耦合导致的姿态计算误差累积问题,精准把握速度与姿态的关系。确定运动姿态后,将其与图像数据匹配,并通过全局优化算法完成运动姿态特征的捕捉。实验结果显示,上述方法动作捕捉实际应用效果良好、消融后捕捉精度高且主分量分布特征显著。 展开更多
关键词 多维传感器 运动姿态特征 动作捕捉 信号处理 主分量分析
在线阅读 下载PDF
面向多机协同探索的分布式SLAM方法
14
作者 邓开阳 郑永航 +2 位作者 罗义藩 张航铖 解杨敏 《计算机工程与设计》 北大核心 2026年第2期560-567,共8页
传统协同定位依赖高频位姿或观测数据交互,难以适应带宽受限环境;单机回环检测框架在多机协同中难以有效融合时空关联性,制约全局地图一致性提升。针对上述问题,提出了一种基于特征点集的分布式SLAM新方法。利用LIOSAM作为各机器人的前... 传统协同定位依赖高频位姿或观测数据交互,难以适应带宽受限环境;单机回环检测框架在多机协同中难以有效融合时空关联性,制约全局地图一致性提升。针对上述问题,提出了一种基于特征点集的分布式SLAM新方法。利用LIOSAM作为各机器人的前端里程计,通过关键帧提取轻量化特征点集,并基于最小生成树的邻域广播机制共享数据,降低通信开销。运用RANSAC和ICP算法进行机器人间的回环检测和精确配准。将机器人内部和机器人间的约束整合到了多机器人位姿图中,优化了多机器人系统的位姿估计,增强了系统的鲁棒性与精度。实验结果表明,所提方法能有效减轻机器人间的通信开销,并提升多机器人系统在复杂环境中的导航与定位精度。 展开更多
关键词 同时定位与建图 多机器人协同 位姿图 通信开销 回环检测 地图融合 地图优化
在线阅读 下载PDF
复杂场景移动机器人定位与建图研究进展
15
作者 张怡俊 崔国华 +2 位作者 张振山 何维瀚 薛慧 《控制工程》 北大核心 2026年第2期291-302,共12页
同步定位与建图(simultaneous localization and mapping, SLAM)技术是移动机器人研究及应用的关键问题,旨在解决机器人在复杂环境中实现自主定位与地图构建等功能。对SLAM的系统组成、关键技术及应用进行了简要介绍;重点围绕特征点法... 同步定位与建图(simultaneous localization and mapping, SLAM)技术是移动机器人研究及应用的关键问题,旨在解决机器人在复杂环境中实现自主定位与地图构建等功能。对SLAM的系统组成、关键技术及应用进行了简要介绍;重点围绕特征点法、滤波法、图优化法、多传感器融合和动态场景5个方面,综述了SLAM系统的关键技术、国内外研究现状及标志性应用进展;并结合代表性系统,比较分析了不同方法之间的优缺点,详细阐述了多传感器融合SLAM系统,同时对复杂场景下的SLAM技术进行了展望。 展开更多
关键词 复杂场景 移动机器人 定位与建图 位姿估计 多传感器融合
原文传递
多视角转台双姿态构建钕铁硼永磁体点云模型
16
作者 郑胜 李占福 +1 位作者 林泽 童昕 《福建理工大学学报》 2026年第1期74-80,共7页
针对钕铁硼永磁体产线快速检测与缺陷反馈工艺系统对表面结构完整性及细节特征定量表征的需求,及传统单视角采集存在的覆盖率不足、缺陷细节丢失等问题,提出一种基于多视角转台与双姿态配合的钕铁硼永磁体三维点云构建方法。通过转台参... 针对钕铁硼永磁体产线快速检测与缺陷反馈工艺系统对表面结构完整性及细节特征定量表征的需求,及传统单视角采集存在的覆盖率不足、缺陷细节丢失等问题,提出一种基于多视角转台与双姿态配合的钕铁硼永磁体三维点云构建方法。通过转台参数标定与标定块姿态变换配准,对永磁体在两种固定姿态下的点云进行拼接融合。实验结果表明,多视角双姿态点云重建方法能够实现表面覆盖率超过95%的三维点云重建,点云拼接精度的均方根误差为0.15 mm,可用于永磁体三维表面缺陷分析。 展开更多
关键词 钕铁硼永磁体 三维点云 多视角拼接 姿态配准
在线阅读 下载PDF
结合混合注意力与多尺度特征的人体姿态估计
17
作者 谷学静 栗燕茹 杨蓝潇 《计算机工程与科学》 北大核心 2026年第3期531-539,共9页
针对遮挡场景下多人姿态估计准确率低的问题,提出了一种结合混合注意力机制和多尺度序列特征的人体姿态估计模型DAW-YOLOPose。首先,采用MLCA注意力机制改进YOLOv8Pose的主干网络,在不增加模型参数量的同时有效捕获并传递空间和通道信息... 针对遮挡场景下多人姿态估计准确率低的问题,提出了一种结合混合注意力机制和多尺度序列特征的人体姿态估计模型DAW-YOLOPose。首先,采用MLCA注意力机制改进YOLOv8Pose的主干网络,在不增加模型参数量的同时有效捕获并传递空间和通道信息,以提升网络的特征表达效果。其次,提出了一种全新的多尺度序列特征融合网络,增强多尺度特征信息提取能力,同时融合不同尺度的特征映射。最后,使用Wise-IoU v3损失函数的梯度增益分配策略,提高对高质量锚框的区分能力,减少低质量样本对模型训练的负面影响。在MSCOCO数据集上的实验结果表明,DAW-YOLOPose与YOLOv8Pose相比,mAP@0.5,mAP@0.5:0.95和召回率分别提升2.7个百分点、1.4个百分点和1.9个百分点,实现了更优越的姿态估计效果。 展开更多
关键词 YOLOPose 人体姿态估计 注意力机制 多尺度序列特征 损失函数
在线阅读 下载PDF
多自由度机械臂目标抓取位姿智能估计算法
18
作者 潘夏福 陆凯 张博 《机械设计与制造》 北大核心 2026年第2期374-379,共6页
在复杂且多变的非结构化环境中,多自由度机械臂抓取目标物体呈现出高度的多样性和不规则性,使得控制点位置不确定性增加,导致机械臂在抓取任务常出现较大偏差,提出多自由度机械臂目标抓取位姿智能估计算法。通过求解多自由度机械臂正运... 在复杂且多变的非结构化环境中,多自由度机械臂抓取目标物体呈现出高度的多样性和不规则性,使得控制点位置不确定性增加,导致机械臂在抓取任务常出现较大偏差,提出多自由度机械臂目标抓取位姿智能估计算法。通过求解多自由度机械臂正运动学、逆运动学方程确定各关节的角度值,得到末端执行器位置。采用五参数矩形模型分析目标特征并确定目标位置和方向。利用高效透视n点算法(Efficient Perspective-n-Point,EPnP)算法明确末端执行器和目标位置空间基准点与相机坐标系的关系,以此确定四个虚拟控制点的位置。根据控制点位置使用二次贝塞尔曲线生成移动曲线,从而实现目标抓取位姿智能估计。实验结果表明,所提算法能够实现位姿智能估计,减少机械臂碰撞,且平均距离误差在4mm以下,机械臂角度误差小,能够以正确的角度和位置抓取目标物体。 展开更多
关键词 多自由度机械臂 目标抓取 位姿智能估计 虚拟控制点 旋转矩阵
在线阅读 下载PDF
基于结构引导的人体姿态估计框架
19
作者 涂浚 武港山 王利民 《计算机学报》 北大核心 2026年第4期760-781,共22页
近年来,2D人体姿态估计作为计算机视觉中的基础任务,广泛应用于行为识别、人机交互等领域。尽管基于深度学习的姿态估计方法取得了显著进展,但在多人拥挤、遮挡复杂及低分辨率等实际场景下,现有方法往往面临结构信息利用不足、优化路径... 近年来,2D人体姿态估计作为计算机视觉中的基础任务,广泛应用于行为识别、人机交互等领域。尽管基于深度学习的姿态估计方法取得了显著进展,但在多人拥挤、遮挡复杂及低分辨率等实际场景下,现有方法往往面临结构信息利用不足、优化路径粗糙等问题,导致模型的姿态结构建模能力有限、泛化鲁棒性不强。为此,本文提出了一种基于结构引导的多步优化框架,将姿态估计过程建模为从初始粗略预测逐步优化至结构合理目标的多阶段演化路径。该框架通过显式构造渐变图序列,引导网络在每一步预测中持续融合结构先验信息,并在训练与推理阶段保持结构引导路径的一致性,从而有效提升模型的结构建模能力与预测稳定性。系统性消融实验表明,所提出的渐变图序列和路径一致性设计对于提升关键点定位精度和结构约束能力具有显著效果;参数敏感性分析进一步验证了插值步数与调度策略等可调参数对模型性能的影响。在COCO和CrowdPose等主流数据集上的实验结果表明,本文方法在HRNet-W48骨干网络下、CrowdPose验证集上取得77.6 mAP,超过当前先进方法TransPose-H(76.3 mAP);在COCO验证集256×192分辨率和检测框设定下同样实现了75.6 mAP,与主流Transformer方法持平或更优,验证了本方法在多种复杂场景下的有效性与通用性。 展开更多
关键词 2D人体姿态估计 结构引导 结构建模 渐变图序列 多步优化
在线阅读 下载PDF
面向学前教育的机器人智能控制系统设计与研究
20
作者 倪娜 《自动化与仪器仪表》 2026年第1期292-296,302,共6页
为了解决学前教育机器人位姿精度不准等问题,研究提出一种基于樽海鞘算法的学前教育机器人智能控制系统。该系统利用樽海鞘算法进行区域最优搜索,跟随配置网络进行路径跟踪控制。实验结果表明,利用樽海鞘融合机器人动作识别算法的测试者... 为了解决学前教育机器人位姿精度不准等问题,研究提出一种基于樽海鞘算法的学前教育机器人智能控制系统。该系统利用樽海鞘算法进行区域最优搜索,跟随配置网络进行路径跟踪控制。实验结果表明,利用樽海鞘融合机器人动作识别算法的测试者7号、11号在13名测试者内平均相对误差较大,平均相对误差分别为-2.8%、3.2%。此外,研究所构建的机器人智能控制系统在x轴、y轴皆为5 m时两个直角转弯处轨迹与实际轨迹重合。而深度神经网络机器人智能控制系统的直角转弯轨迹与实际轨迹误差x轴相差0.4 m,y轴相差0.2 m。综上所述,研究构建的机器人智能控制系统能够提高学前儿童位姿检测能力。研究有助于未来满足学前教育教学要求,引导学前儿童进行人机交互。 展开更多
关键词 学前教育 SSA 位姿识别 智能控制 多传感信息融合
原文传递
上一页 1 2 19 下一页 到第
使用帮助 返回顶部