-
题名基于有模型强化学习的飞行器制导技术研究
- 1
-
-
作者
滕庆骅
惠俊鹏
李天任
杨奔
-
机构
中国运载火箭技术研究院研究发展中心
北京长征航天飞行器研究所
-
出处
《宇航总体技术》
2025年第2期26-34,共9页
-
文摘
面向避障、绕飞等任务驱动的飞行器在线轨迹,为了提升制导性能,适应快速变化的复杂场景,聚焦于充分利用飞行器模型中的已知信息,基于iLQR这种有模型强化学习方法,设计了智能化的制导方式。与无模型强化学习相比,有模型强化学习的可解释性好,训练难度低。在单飞行器制导仿真中,相比TD3算法,iLQR方法飞行过程平均制导误差增加了28.07%,中末交班点误差降低到12.35%,提升幅度巨大;在多飞行器编队保持问题上,相比TD3算法,iLQR方法跟踪效果提升巨大,平均误差不超过TD3算法的22.67%,最大误差不超过TD3算法的15.44%。
-
关键词
ilqr算法
有模型强化学习
标准轨迹制导
强化学习制导
编队保持
-
Keywords
ilqr algorithm
Model-based reinforcement learning
Standard trajectory guidance
Reinforcement learning guidance
Formation keeping
-
分类号
V448.1
[航空宇航科学与技术—飞行器设计]
-