期刊文献+

基于Q学习算法和BP神经网络的倒立摆控制 被引量:55

在线阅读 下载PDF
导出
摘要 Q学习是Watkins[1]提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.将Q学习算法和BP神经网络有效结合,实现了状态未离散化的倒立摆的无模型学习控制.仿真表明:该方法不仅能成功解决确定和随机倒立摆模型的平衡控制,而且和Anderson[2]的AHC(AdaptiveHeuristicCritic)等方法相比,具有更好的学习效果.
出处 《自动化学报》 EI CSCD 北大核心 1998年第5期662-666,共5页 Acta Automatica Sinica
基金 国家自然科学基金
  • 相关文献

参考文献1

  • 1Peng J,博士学位论文,1993年

同被引文献500

引证文献55

二级引证文献365

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部