基于近端策略优化的两栖无人平台路径规划算法研究被引量：2

Path Planning Algorithm of Amphibious Unmanned Platform Based on Proximal Policy Optimization

下载PDF

导出

摘要为解决水陆两栖无人平台在复杂环境中的路径规划问题,针对传统方法难以应对动态障碍物和多变环境的局限性,提出了一种基于近端策略优化(PPO)的路径规划算法,包含四种感知信息输入方案以及速度强化奖励函数,适应动态和静态环境.该算法通过批次函数正则化、策略熵引入和自适应裁剪因子,显著提升了算法的收敛速度和稳定性.研究中采用了ROS仿真平台,结合Flatland物理引擎和PedSim插件,模拟了包含动态障碍物的多种复杂场景.实验结果表明,采用BEV+V状态空间输入结构和离散动作空间的两栖无人平台,在路径规划中展现出高成功率和低超时率,优于传统方法和其他方案.仿真和对比实验显示采用鸟瞰图与速度组合的状态空间数据结构配合速度强化奖励函数算法提高了性能,收敛速度提高25.58%,路径规划成功率提升25.54%,超时率下降13.73%. In order to solve the algorithm problem of the training speed and stability in local path planning of am-phibious unmanned platform,a proximal policy optimization(PPO)algorithm was improved,establishing a foundation of multi-sensory information input for the amphibious platform.Actually,four perceptual informa-tion input schemes and speed-enhanced reward function were proposed to adapt to the dynamic and static envir-onment.The experimental results show that the amphibious unmanned platform with BEV+V state-space input structure and discrete action space demonstrates high success rate and low timeout rate in path planning,which is superior to the traditional methods and other schemes.Simulation and comparative experiment results show that the state space data structure with the combination of aerial view and speed combined with the speed enhance-ment reward function algorithm can improve the algorithm performance,increasing convergence speed up to 25.58%,the success rate of path planning up to 25.54%,and descending the timeout rate by 13.73%.

作者左哲覃卫徐梓洋李寓安陈泰然 ZUO Zhe;QIN Wei;XU Ziyang;LI Yu'an;CHEN Tairan(School of Mechanical Engineering,Beijing Institute of Technology,Beijing 100081,China)

机构地区北京理工大学机械与车辆学院

出处《北京理工大学学报》 EI CAS 北大核心 2025年第1期19-25,共7页 Transactions of Beijing Institute of Technology

基金北京理工大学重点实验室项目(2022-CXPT-LC-003-01)。

关键词路径规划两栖无人平台近端策略优化(PPO) path planning amphibious unmanned platform proximal policy optimization(PPO)

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020,2(4):314-326. 被引量：64
2刘泽森,毕盛,郭传鈜,王延葵,董敏.基于深度学习的机器人局部路径规划方法[J].系统仿真学报,2024,36(5):1199-1210. 被引量：10
3肖竹,谢宁,陈佳黎,刘保生,姜峰,杨郭镳.Fast-PPO:最优基线法的近端策略优化算法[J].小型微型计算机系统,2020,41(7):1351-1356. 被引量：5
4王庭晗,罗禹贡,刘金鑫,李克强.基于考虑状态分布的深度确定性策略梯度算法的端到端自动驾驶策略[J].清华大学学报（自然科学版）,2021,61(9):881-888. 被引量：6
5唐俊,杨友波,张目,雷印杰.基于深度强化学习的密集动态环境导航避障[J].现代计算机,2023,29(7):54-58. 被引量：1
6胡宇辉,王旭,胡家铭,龚建伟,王克,李桂鹏,梅程.越野环境下无人驾驶车辆技术研究综述[J].北京理工大学学报,2021,41(11):1137-1144. 被引量：25
7王美玲,骆健恒,杨毅,刘彤,李亚峰.GIS在无人车自主导航中的应用分析[J].北京理工大学学报,2019,39(9):907-911. 被引量：9
8汪成亮,严君辉.大规模无线传感网络数据收集的无人机路径规划[J].北京理工大学学报,2015,35(10):1044-1049. 被引量：8

二级参考文献43

1Li C, Zhang H, Hao B, et al. A survey on routing protocols for large-scale wireless sensor networks[J]. Sensors, 2011,11(4) :3498 - 3526.
2Guo S, Yang Y. A distributed optimal framework for mobile data gathering with concurrent data uploading in wireless sensor networks [ C ]//INFOCOM, 2012 Proceedings IEEE. IS. 1. ].. IEEE, 2012:1305 - 1313.
3Martinez-de Dios J R, I.ferd K, de San Bernab6 A, et al. Cooperation between uas and wireless sensor networks for efficient data collection in large environments [J]. Journal of Intelligent 8 Robotic Systems, 2013,70(1 - 4) ..491 - 508.
4Ramadurai V, Sichitiu M L. Localization in wireless sensor networks: a probabilistic approach [C]// Proceedings of International Conference on Wireless Networks. [S. 1.1: IEEE, 2003:275 -281.
5I.ev-Tov N, Peleg D. Polynomial time approximation schemes for base station coverage with minimum total radii[J]. Computer Networks, 2005,47(4) :489 - 501.
6Lange S, Sunderhauf N, Protzel P. A vision based onboard approach for landing and position control of an autonomous multirotor UAV in GPS-denied environments [ C ] // Proceedings of International Conference on Advanced Robotics. [ S. 1. ]: IEEE, 2009 : 1 - 6.
7Alba Martinez M A, Cordeau J F, Dell'Amico M, et al. A branch-and-cut algorithm for the double traveling salesman problem with multiple stacks[J]. INFORMS Journal on Computing, 2013,25(1) :41 - 55.
8Cook W, Espinoza D. Computing with domino parity in- qualities for the TSP [J]. INFORMS Journal on Computing, 2007,19(3) :356 - 365.
9李清泉,黄练.基于GPS轨迹数据的地图匹配算法[J].测绘学报,2010,39(2):207-212. 被引量：64
10方彦军,周亭亭,方源.基于GIS和环境感知的无人车定位方法研究[J].自动化与仪表,2012,27(5):1-4. 被引量：4

共引文献120

1沈凯,刘庭欣,左思琪,邓明涛.复杂城市环境下GNSS/INS组合导航可观测度分析及鲁棒滤波方法[J].仪器仪表学报,2020(9):252-261. 被引量：25
2戴丽.混合Nash均衡的无人机航路规划应用案例[J].数学理论与应用,2019(3):121-128.
3方斌,王启东.无线网络异质复杂信息节点搜索路径寻优仿真[J].计算机仿真,2018,35(9):386-390. 被引量：1
4赵峰,姜攀.基于无线传感网络的农业无人机航线控制系统[J].农机化研究,2019,41(1):226-229. 被引量：9
5付志荣.异构无线传感器网络中高效路由分簇算法研究[J].新乡学院学报,2020,37(6):26-31.
6于洋,王天歌,王淼.基于GPS和四线激光雷达的无人车导航系统设计[J].沈阳理工大学学报,2020,39(2):13-17. 被引量：3
7李明,刘若愚,姜春兰,寇家勋.基于无线智能节点的远程控制系统设计与实现[J].北京理工大学学报,2020,40(8):849-855. 被引量：12
8汪成亮,黄利莹,赵凯.多粒度时空事件序列相似度算法研究[J].北京理工大学学报,2021,41(1):102-111. 被引量：2
9蒋宝庆,陈宏滨.基于Q学习的无人机辅助WSN数据采集轨迹规划[J].计算机工程,2021,47(4):127-134. 被引量：6
10陈潜,陆满君,宋柯,于祥祯,杜科.相控阵雷达导引头技术现状及发展趋势[J].上海航天（中英文）,2021,38(3):157-162. 被引量：15

同被引文献10

1田洪清,王建强,黄荷叶,丁峰.越野环境下基于势能场模型的智能车概率图路径规划方法[J].兵工学报,2021,42(7):1496-1505. 被引量：17
2翟丽,张雪莹,张闲,王承平.基于势场法的无人车局部动态避障路径规划算法[J].北京理工大学学报,2022,42(7):696-705. 被引量：41
3任秉韬,王淅淅,邓伟文,南江峰,纵瑞雪,丁娟.基于混合A^(*)和可变半径RS曲线的自动泊车路径优化方法[J].中国公路学报,2022,35(7):317-327. 被引量：34
4李泽阳,陈泰然,刘昊然,黄彪,王国玉.水陆两栖无人平台技术研究进展[J].数字海洋与水下攻防,2023,6(3):259-273. 被引量：3
5田洪清,马明涛,张博,郑讯佳.越野环境下势场搜索树智能车辆路径规划方法[J].兵工学报,2024,45(7):2110-2127. 被引量：2
6聂士达,刘辉,廖志昊,谢雨佳,项昌乐,韩立金,林思豪.考虑复杂地形的越野环境无人车辆路径规划研究[J].机械工程学报,2024,60(10):261-272. 被引量：6
7刘海鸥,薛明轩,关海杰,陶俊峰,陈慧岩.基于分层2.5D地图的无人履带车辆路径规划[J].北京理工大学学报,2024,44(8):771-779. 被引量：5
8刘秀钰,刘志浩,程洪杰,高钦和.考虑避障稳定性的多轴特种车安全轨迹规划方法[J].北京理工大学学报,2024,44(8):809-819. 被引量：3
9陈慧岩,司璐璐,王旭睿,王文硕.复杂越野场景无人履带平台3D语义占据预测方法[J].北京理工大学学报,2025,45(1):1-10. 被引量：2
10陈泰然,龙金成,李泽阳,粟慧.桨式轮驱动的高速水陆两栖平台水面航行特性研究[J].北京理工大学学报,2025,45(6):589-599. 被引量：1

引证文献2

1陈漫,谭赟璐,于亮,刘宇键,王浩东,张小鹏.改进Hybrid A*算法的履带车辆路径规划[J].北京理工大学学报,2025,45(8):807-814. 被引量：2
2左哲,蓝鸿,覃卫,王坤.基于SAM的水陆两栖环境感知微调策略与应用[J].北京理工大学学报,2026,46(1):20-28.

二级引证文献2

1周寅飞,张立华,贾帅东,戴泽源.面向舰艇导攻需求的航路自动规划算法[J].兵器装备工程学报,2025,46(11):94-103.
2王文豪,刘冉冉,李杭宇,褚洪要.基于能耗模型的改进JPS算法无人车路径规划研究[J].江苏理工学院学报,2025,31(5):101-110.

1张燚.基于DSP的水下无人平台发射功放检测与保护电路设计[J].声学与电子工程,2024(4):33-36.
2黄子橙.基于数字化技术的马德堡半球实验设计与创新研究[J].中学物理,2024,42(22):45-48.
3杜婧银,吴晓莉,瞿敏.动态视觉搜索任务中工业制造界面滚动数量与速度的组合呈现研究[J].机械设计与制造工程,2024,53(10):108-112.
4唐波,张博,胡海琴,陶军,姚嘉智.基于北斗短报文的配电网数据传输应用研究[J].电子设计工程,2024,32(22):128-132.
5刘晓庆.VR技术在农场游戏开发中的应用[J].农机化研究,2025,47(3):222-226. 被引量：2
6周志耀,马常霞,杨丽莎,仲兆满,胡文彬.基于轻量级改进的YOLOv8水下目标检测模型[J].电子测量技术,2024,47(19):181-189. 被引量：2
7曾庆有,叶晨峰,刘俊俊,冯凯,程沛媛,陈伟宏.基于LS-DYNA的ECC管桩的抗冲击性能分析[J].中外公路,2024,44(5):210-217.
8赵艳东.继电保护二次系统的故障诊断与处理技术[J].大众用电,2024(10):52-54. 被引量：4
9高祈祈,齐文娥.包容型领导对中小企业员工敬业度提升的影响研究[J].河北企业,2024(12):77-81.
10朱艺博.动态场景下深度学习SLAM算法的准确[J].微型计算机,2024(12):40-42.

北京理工大学学报

2025年第1期

浏览历史

内容加载中请稍等...

基于近端策略优化的两栖无人平台路径规划算法研究被引量：2

参考文献8

二级参考文献43

共引文献120

同被引文献10

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于近端策略优化的两栖无人平台路径规划算法研究 被引量：2

参考文献8

二级参考文献43

共引文献120

同被引文献10

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于近端策略优化的两栖无人平台路径规划算法研究被引量：2