概率预测强化学习下非结构环境机械臂变阻抗力跟踪控制

Probability Prediction Reinforcement Learning for Variable Impedance Force Tracking Control of Robotic Arms in Unstructured Environments

下载PDF

导出

摘要针对非结构环境下末端实时移动机械臂阻抗控制力跟踪问题,通过动态调节阻尼系数以应对接触环境的不确定性。为确保阻抗策略的高效搜索,利用机械臂与接触环境交互产生状态-动作序列构建概率预测模型(PPM)。学习过程中,机械臂仅需与非结构接触环境进行少量交互即可获得最优变阻抗策略,这使得该过程在真实机械臂上直接训练成为可能。仿真实验表明,在几种非结构环境下,所提出的方法使力跟踪动态和稳态性能均明显优于传统阻抗控制和自适应变阻抗控制。 Aiming at the real time impedance control force tracking problems of the end mobile robotic arm in a unstructured environment,the damping coefficient is dynamically adjusted to cope with the uncertainty of the contact environment.To ensure efficient search of the impedance strategy,a probabilistic prediction model(PPM)is constructed by utilizing the interaction between the robotic arm and the contact environment to generate state action sequences.During the learning process,the robotic arm only needs to interact minimally with the unstructured contact environment to obtain the optimal variable impedance strategy.This makes it possible to directly train the process on a real robotic arm.Simulation results show that in several unstructured environments,the proposed method significantly outperforms the traditional impedance control and adaptive variable impedance control in both dynamic and steady state force tracking performance.

作者董梓呈胡伟石邵辉郭霖 DONG Zicheng;HU Weishi;SHAO Hui;GUO Lin(College of Information Science and Engneering,Huaqiao University,Xiamen 361021,China;Department of Laboratory and Device Management,Huaqiao University,Xiamen 361021,China)

机构地区华侨大学信息科学与工程学院华侨大学实验室与设备管理处

出处《华侨大学学报（自然科学版）》 CAS 2024年第4期461-470,共10页 Journal of Huaqiao University(Natural Science)

基金福建省自然科学基金资助项目(2021J01291) 华侨大学研究生教育教学改革研究项目(22YJG006)。

关键词变阻抗控制机械臂力跟踪强化学习非结构环境概率预测模型 variable impedance control robotic arm force tracking reinforcement learning unstructured environment probability prediction model

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献3

1刘胜遂,李利娜,熊晓燕,张金柱,刘畅.基于卡尔曼滤波的机器人自适应控制方法研究[J].机电工程,2023,40(6):936-944. 被引量：15
2倪涛,黎锐,缪海峰,徐春博,陈宁,黄玲涛.船载机械臂末端位置实时补偿[J].吉林大学学报（工学版）,2020,50(6):2028-2035. 被引量：3
3李振,赵欢,王辉,丁汉.机器人磨抛加工接触稳态自适应力跟踪研究[J].机械工程学报,2022,58(9):200-209. 被引量：24

二级参考文献34

1王守平.外军海上补给装备发展趋势[J].航海,2007(4):26-27. 被引量：4
2李庆瀛,褚金奎,李荣华,王洪青.基于卡尔曼滤波的移动机器人运动目标跟踪[J].传感器与微系统,2008,27(11):66-68. 被引量：20
3王良勇,柴天佑.带有神经网络补偿的机械手PD控制[J].中国电机工程学报,2009,29(12):110-115. 被引量：20
4彭丁聪.卡尔曼滤波的基本原理及应用[J].软件导刊,2009,8(11):32-34. 被引量：223
5马建明,何景峰,熊海国,韩俊伟.六自由度运动模拟器振动控制策略[J].吉林大学学报（工学版）,2010,40(2):511-516. 被引量：5
6邱志成,赵明扬,谈大龙,房立金,徐志刚.一种具有波浪补偿和防晃功能的船用起重机[J].工程机械,1999,30(2):12-13. 被引量：7
7李晶,范九伦.一种基于卡尔曼滤波的运动物体跟踪算法[J].计算机应用研究,2010,27(8):3162-3164. 被引量：24
8徐国政,宋爱国,李会军.基于模糊逻辑的上肢康复机器人阻抗控制实验研究[J].机器人,2010,32(6):792-798. 被引量：22
9汪军,沈姣.桥式起重机吊重随小车运行时的摆动仿真[J].机械研究与应用,2010,23(6):21-23. 被引量：6
10WANG Wei YUN Chao.A Path Planning Method for Robotic Belt Surface Grinding[J].Chinese Journal of Aeronautics,2011,24(4):520-526. 被引量：36

共引文献39

1孔繁旭,吕鹏,王洪光,常勇.基于无源观测器的机器人笛卡尔空间力/阻抗控制方法[J].科学技术与工程,2022,22(35):15675-15680. 被引量：2
2周健,郑联语,樊伟,张学鑫,曹彦生.工业机器人定位误差在线自适应补偿[J].机械工程学报,2023,59(5):53-66. 被引量：9
3刘胜遂,李利娜,熊晓燕,张金柱,刘畅.基于卡尔曼滤波的机器人自适应控制方法研究[J].机电工程,2023,40(6):936-944. 被引量：15
4黄旺,曹鹏彬,于宝成.基于环境参数估计的月季采摘柔顺抓取研究[J].武汉工程大学学报,2023,45(3):325-330. 被引量：1
5金锋扬,秦菲菲,郭振武,王斌锐.机械臂接触力跟踪自适应变导纳控制方法[J].中国计量大学学报,2023,34(2):216-223. 被引量：3
6李冬武,张洁,汪俊亮,徐楚桥.细纱接头机器人神经网络自适应力跟踪导纳控制[J].机械工程学报,2023,59(11):221-231. 被引量：3
7刘运忠,姜宏,章翔峰.基于PSO优化的模糊PID恒力控制研究[J].电子测量技术,2023,46(9):16-22. 被引量：9
8王柯竣,胡乃瑞.基于CH32的多车编队小车的设计[J].工业控制计算机,2023,36(9):154-155.
9邓建新,袁邦颐,黄秋林,丁度坤.基于快速终端滑模的机器人柔顺磨抛阻抗控制[J].组合机床与自动化加工技术,2023(11):79-83. 被引量：4
10王昊祥,冯艳,潘睿智,张洪溥,周依霖,熊根良,张华.光纤光栅波电转换的人机仿生跟随[J].光学精密工程,2023,31(23):3414-3425. 被引量：1

1杨崇英,王金锋.机械臂力/位跟踪的无源自抗扰控制器设计[J].机械设计与制造,2024(5):146-150.
2房开乾,王鑫鑫,欧叶玉.基于深度学习的档案辅助分类应用研究[J].机电兵船档案,2024(3):86-90. 被引量：1
3郭小华.财务风险管控视角下的财务内部控制策略[J].中国经贸,2024(14):63-65. 被引量：1
4高嵩,朱德翔,谢雄耀,周彪,周应新,王皓正,罗世卫.山区公路隧道衬砌裂缝快速检测及智能识别技术研究[J].公路,2024,69(4):394-400. 被引量：7
5徐沈仁.长距离无线激光传输设备的信号捕获与自动跟踪[J].数字技术与应用,2024,42(2):223-225.
6余翎瑞,卢秋红,薛阳.移动机器人滑膜变结构轨迹跟踪控制[J].科技与创新,2024(15):30-32. 被引量：1
7强化自主创新保障安防技术应用安全可控[J].中国安防,2024(7):82-82.
8陈新宇,王卫斌,陆光辉.基于AI agent的6G内生智能技术框架及其应用[J].移动通信,2024,48(7):28-32. 被引量：2
9张会琼,薛陈利,熊靓辉,安天浩,耿健.中国锑产业发展与挑战[J].矿产勘查,2024,15(7):1318-1324. 被引量：4
10李浩宇,张春,吴零晨,童泽军.基于改进有限时间一致性的微电网经济优化调度[J].电力系统及其自动化学报,2024,36(7):38-48. 被引量：7

华侨大学学报（自然科学版）

2024年第4期

浏览历史

内容加载中请稍等...

概率预测强化学习下非结构环境机械臂变阻抗力跟踪控制

参考文献3

二级参考文献34

共引文献39

相关作者

相关机构

相关主题

浏览历史