基于改进DDPG的多AGV路径规划算法

Multi-AGV Path Planning Algorithm Based on Improved DDPG

下载PDF

导出

摘要在自动化和智能物流领域,多自动引导车(Automated Guided Vehicle,AGV)系统的路径规划是关键技术难题。针对传统深度强化学习方法在多AGV系统应用中的效率、协作竞争和动态环境适应性问题,提出了一种改进的自适应协同深度确定性策略梯度算法Improved-AC-DDPG(Improved-Adaptive Cooperative-Deep Deterministic Policy Gradient)。该算法通过环境数据采集构建状态向量,并实时规划路径,动态生成任务序列以减少AGV间的冲突,同时监测并预测调整避障策略,持续优化策略参数。实验结果表明,与常规DDPG和人工势场优化DDPG(Artificial Potential Field-Deep Deterministic Policy Gradient,APF-DDPG)算法相比,Improved-AC-DDPG在收敛速度、避障能力、路径规划效果和能耗方面均表现更佳,显著提升了多AGV系统的效率与安全性。本研究为多智能体系统在动态环境中的建模与协作提供了新思路,具有重要的理论价值和应用潜力。 In the field of intelligent logistics,the challenge of path planning and obstacle avoidance for automated guided vehicles(AGVs)is significant.Traditional deep reinforcement learning(DRL)methods exhibit limitations in efficiency,dynamic adaptability,and handling competitive-cooperative interactions among multiple AGVs.This paper presents the improved adaptive cooperative deep deterministic policy gradient(Improved-AC-DDPG)algorithm,an advancement over the standard DDPG.It leverages environmental data to construct state vectors and employs a real-time path planning strategy that dynamically creates task sequences to prevent AGV conflicts.This algorithm also includes continuous policy parameter optimization for obstacle avoidance.Experiments show that the Improved-AC-DDPG surpasses both the standard DDPG and the artificial potential field optimization DDPG(APF-DDPG)in convergence speed,obstacle avoidance,path planning,and energy efficiency,thus enhancing multi-AGV system performance.This study provides innovative insights and solutions for multi-agent system modeling and collaboration in dynamic environments,with substantial theoretical and practical implications.

作者赵学健叶昊李豪孙知信 ZHAO Xuejian;YE Hao;LI Hao;SUN Zhixin(Modern Postal College,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;Jiangsu Postal Big Data Technology and Application Engineering Research Center,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;State Post Bureau Postal Industry Technology Research and Development Center(Internet of Things Technology),Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

机构地区南京邮电大学现代邮政学院南京邮电大学江苏省邮政大数据技术与应用工程研究中心南京邮电大学国家邮政局邮政行业技术研发中心(物联网技术)

出处《计算机科学》北大核心 2025年第6期306-315,共10页 Computer Science

基金国家自然科学基金(61972208) 中国博士后科学基金(2018M640509) 江苏省研究生科研与实践创新计划项目(SICX23_0303,SJCX24_0339)。

关键词 AGV 路径规划深度强化学习 DDPG AGV Path planning Deep reinforcement learning DDPG

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献3

1赵学健,叶昊,贾伟,孙知信.AGV路径规划及避障算法研究综述[J].小型微型计算机系统,2024,45(3):529-541. 被引量：27
2熊俊涛,李中行,陈淑绵,郑镇辉.基于深度强化学习的虚拟机器人采摘路径避障规划[J].农业机械学报,2020,51(S02):1-10. 被引量：38
3田帅辉,沈亦凡,欧丽英,樊略.考虑负载量均衡的自动拣货系统AGV任务分配优化[J].计算机应用研究,2024,41(8):2366-2373. 被引量：7

二级参考文献56

1孟宪福,张晓燕.对等网络环境下多目标约束的并行任务调度策略研究[J].计算机集成制造系统,2008,14(4):761-766. 被引量：6
2张京钊,江涛.改进的自适应遗传算法[J].计算机工程与应用,2010,46(11):53-55. 被引量：57
3乐阳,龚健雅.Dijkstra最短路径算法的一种高效率实现[J].武汉测绘科技大学学报,1999,24(3):209-212. 被引量：248
4张远春,范秀敏,驹田邦久.基于仿真优化的多种类型AGV数量配置优化方法[J].中国机械工程,2011,22(14):1680-1685. 被引量：23
5方耀宁,郭云飞,扈红超,兰巨龙.一种基于Sigmoid函数的改进协同过滤推荐算法[J].计算机应用研究,2013,30(6):1688-1691. 被引量：10
6高文.教学设计研究——荷兰土温蒂大学Sanne Dijkstra教授访谈录[J].全球教育展望,2001,30(1):7-13. 被引量：45
7随裕猛,陈贤富,刘斌.D-star Lite算法及其动态路径规划实验研究[J].微型机与应用,2015,34(7):16-19. 被引量：14
8滕举元,许洪斌,王毅,张哲.采摘机器人机械臂运动轨迹规划设计仿真[J].计算机仿真,2017,34(4):362-367. 被引量：21
9王曌,胡立生.基于深度Q学习的工业机械臂路径规划方法[J].化工自动化及仪表,2018,45(2):141-145. 被引量：6
10熊超,解武杰,董文瀚.基于碰撞锥改进人工势场的无人机避障路径规划[J].计算机工程,2018,44(9):314-320. 被引量：22

共引文献69

1张勤,乐晓亮,李彬,蒋先平,熊征,徐灿.基于CTB-RRT*的果蔬采摘机械臂运动路径规划[J].农业机械学报,2021,52(10):129-136. 被引量：32
2刘顿,王毅.改进Informed-RRT^(*)算法的柑橘采摘机械臂运动路径规划[J].重庆理工大学学报（自然科学）,2021,35(11):158-165. 被引量：11
3段洁利,王昭锐,叶磊,杨洲.水果采摘机械臂运动规划研究进展与发展趋势[J].智能化农业装备学报（中英文）,2021,2(2):7-17. 被引量：9
4李文彪.基于深度强化学习的工业机器人避障路径规划方法[J].制造业自动化,2022,44(1):127-130. 被引量：16
5王涛,黎玉康,刘文学.无人车辆路径规划算法发展现状[J].舰船电子工程,2022,42(5):15-22. 被引量：2
6李萍.基于移动通信终端控制的采摘机器人系统设计[J].农机化研究,2023,45(7):206-209. 被引量：2
7李贤.基于RRT算法的采茶机器人路径规划研究[J].农机化研究,2023,45(9):180-183. 被引量：10
8张趁香.基于目标搜索算法的植保机作业轨迹规划设计[J].农机化研究,2023,45(8):211-214.
9马爱华.基于数学轨迹算法的采摘机器人精准化作业[J].农机化研究,2023,45(10):86-90. 被引量：2
10熊春源,熊俊涛,杨振刚,胡文馨.基于深度强化学习的柑橘采摘机械臂路径规划方法[J].华南农业大学学报,2023,44(3):473-483. 被引量：14

1张日红,陈德照,张瑞华,林桂潮,高翔,薛忠.多机械臂协同采摘技术研究综述[J].科学技术与工程,2025,25(15):6155-6168.
2冉佳森,肖静华.基于数字生态系统的企业跨界服务创新:一项行动研究[J].北京交通大学学报(社会科学版),2025,24(1):75-85. 被引量：2
3吴新斌,马波.核心素养导向的物理任务群教学初探——“熔化和凝固”教学与思考[J].四川教育,2025(15):26-27.
4王云志,刘翔,石蕴玉,徐玉清.冲突和拥堵环境下AGV智能仿真运输系统路径规划研究[J].现代电子技术,2025,48(12):67-71. 被引量：2
5张立彪,温祥西,吴明功,王俊杰,常万昇.基于时间序列的LSTM-RF 4D航迹预测[J].中国安全生产科学技术,2025,21(5):179-186.
6冀中,杨硕,刘景仁,庞彦伟,李学龙.基于数据集和任务偏置的广义持续类别发现[J].中国科学:信息科学,2025,55(5):1073-1087.
7向红,冯忠楠,曹善康,魏繁荣,马云聪,林湘宁.基于低压限流与静止无功补偿器自适应协同的换相失败抑制策略[J].电力系统及其自动化学报,2025,37(5):21-31. 被引量：1
8赵江,杨智,池沛,王英勋.基于分层自主决策和DQN的自适应牧羊控制方法[J].控制与决策,2025,40(5):1523-1532. 被引量：1
9陈容容.大概念视域下传统文化美术项目化学习与评价研究——以闽南非遗主题美育课程开发为例[J].中华活页文选(高中版),2025(9):0133-0135.

计算机科学

2025年第6期

浏览历史

内容加载中请稍等...

基于改进DDPG的多AGV路径规划算法

参考文献3

二级参考文献56

共引文献69

相关作者

相关机构

相关主题

浏览历史