期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Q-Learning算法和神经网络的飞艇控制
被引量:
5
1
作者
聂春雨
祝明
+1 位作者
郑泽伟
武哲
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2017年第12期2431-2438,共8页
针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应...
针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性。采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速。对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性。结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求。本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果。
展开更多
关键词
飞艇
马尔可夫决策过程(MDP)
机器学习
Q-LEARNING
小脑模型关节控制器(CMAC)
原文传递
题名
基于Q-Learning算法和神经网络的飞艇控制
被引量:
5
1
作者
聂春雨
祝明
郑泽伟
武哲
机构
北京航空航天大学航空科学与工程学院
北京航空航天大学自动化科学与电气工程学院
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2017年第12期2431-2438,共8页
基金
国家自然科学基金(61503010)
中央高校基本科研业务费专项资金(YWF-14-RSC-103)~~
文摘
针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性。采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速。对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性。结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求。本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果。
关键词
飞艇
马尔可夫决策过程(MDP)
机器学习
Q-LEARNING
小脑模型关节控制器(CMAC)
Keywords
airship
Markov decision process (MDP)
machine learning
Q-Learning
cerebellar model articulation controller (CMAC)
分类号
V274 [航空宇航科学与技术—飞行器设计]
V249.22 [航空宇航科学与技术—飞行器设计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于Q-Learning算法和神经网络的飞艇控制
聂春雨
祝明
郑泽伟
武哲
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2017
5
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部