-
题名一种基于深度强化学习的协同制导策略
- 1
-
-
作者
谭明虎
艾文洁
何昊麟
李浩宇
王靖宇
-
机构
西北工业大学航天学院
-
出处
《宇航学报》
北大核心
2025年第6期1203-1213,共11页
-
文摘
针对在速度不可控条件下的多弹协同打击问题,提出了一种基于深度强化学习的多弹协同制导策略生成方法。基于多智能体近端策略优化算法,通过构建连续动作空间的智能协同制导框架,设计了一种启发式重塑的奖励函数来引导多枚导弹有效协同打击目标,以解决对制导环境因奖励信号稀疏导致的学习效率低下问题。最后,提出基于多阶段课程学习的智能体平滑动作方法,有效解决强化学习中由独立采样引起的动作抖动问题。仿真实验表明,在随机初始条件范围内,基于深度强化学习制导律生成的协同制导策略可以成功实现对目标的协同攻击。
-
关键词
导弹
协同制导
深度强化学习
多智能体近端策略优化
-
Keywords
Missile
Cooperative guidance
Deep reinforcement learning
Multi-agent proximal policy optimization
-
分类号
V249.7
[航空宇航科学与技术—飞行器设计]
-
-
题名高超声速飞行器变后掠翼分布式协同控制方法
- 2
-
-
作者
卢庆立
孙瑞胜
张振宇
陈炳荣
-
机构
南京理工大学能源与动力工程学院
杭州智元研究院有限公司
-
出处
《宇航学报》
北大核心
2025年第6期1083-1091,共9页
-
文摘
针对高超声速变体飞行器变后掠翼系统中存在关节耦合、气动载荷导致的左右机翼变形不同步问题,提出一种基于径向基函数(RBF)神经网络和干扰观测器的分布式协同变形控制方案。将变后掠翼系统分解成多个单输入单输出子系统,关节耦合、气动载荷等效成子系统的集总干扰,机翼的变形控制问题被改造成各驱动关节的分布式控制问题。为提高各关节间运动协同程度,设计出一种仅需交互部分关节长度信息的协同拓扑网络结构,据此构造协同误差后推导的协同变形控制律可同时消除跟踪误差和同步误差。考虑到变形翼后掠角参数未知,以关节长度作为RBF神经网络的输入对变形控制系统模型进行在线辨识。进一步,在协同控制律中引入干扰观测器的估计值以抵消集总干扰对控制系统造成的影响。仿真结果表明,所提出的分布式协同控制方法能够有效提高系统对变形指令的跟踪精度和双翼运动的同步程度。
-
关键词
高超声速飞行器
变后掠翼
分布式协同控制
RBF神经网络
干扰观测器
-
Keywords
Hypersonic vehicles
Variable sweep wing
Distributed cooperative control
RBF neural network
Disturbance observer
-
分类号
V249.7
[航空宇航科学与技术—飞行器设计]
TP13
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向变后掠过程的飞行器智能抗扰动控制
被引量:1
- 3
-
-
作者
卢家乐
梁小辉
-
机构
西北工业大学自动化学院
-
出处
《宇航学报》
CSCD
北大核心
2024年第12期1997-2008,共12页
-
基金
国家自然科学基金(62203357)
航空科学基金(202300130530)
中央高校科研业务费专项(G2023KY05101)。
-
文摘
针对变后掠飞行器变形过程中复杂气动变化造成的控制系统跟踪性能下降问题,提出了一种基于执行依赖启发式动态规划(ADHDP)的主动抗扰动控制方法,保证变形过程稳定的同时优化了系统的跟踪精度。首先,考虑飞行器变后掠过程中的模型不确定和严重外部扰动,结合扰动观测和反步控制的思想,设计了一种基于自适应神经网络的基础控制器,确保了飞行器在变后掠过程中能够对给定信号稳定控制。然后,将基础控制系统的跟踪误差作为状态量输入执行-评价网络进行在线学习,近似获得最优补偿控制输入,消除了变形过程的气动变化和未建模动态对跟踪性能的影响,进一步提升了变后掠飞行器闭环控制系统的跟踪性能。最后,通过仿真分析证明了所设计控制方法的有效性和优越性。
-
关键词
变后掠飞行器
抗扰动控制
自适应动态规划
神经网络
扰动观测器
-
Keywords
Variable-sweep flight vehicle
Anti-disturbance control
Adaptive dynamic programming
Neural network
Disturbance observer
-
分类号
V249.7
[航空宇航科学与技术—飞行器设计]
-