期刊文献+

深度强化学习原理及其在机器人运动控制中的运用 被引量:3

在线阅读 下载PDF
导出
摘要 深度强化学习技术通过将深度学习和强化学习技术结合起来,利用了深度学习表示能力强和端到端的学习特点,也利用了强化学习自动的决策学习能力以及其完善的算法框架。本文将概括性介绍深度学习、强化学习以及深度强化学习技术的算法框架,并探究深度强化学习技术在机器人运动控制中的应用。
作者 薛天
机构地区 天津市南开中学
出处 《通讯世界》 2018年第8期240-241,共2页 Telecom World
  • 相关文献

参考文献2

二级参考文献99

  • 1Laura RAY.Hierarchical state-abstracted and socially augmented Q-Learning for reducing complexity in agent-based learning[J].控制理论与应用(英文版),2011,9(3):440-450. 被引量:2
  • 2MURRAY R M,ASTROM K M,BODY S P,et al.Future directions in control in an information-rich world[J].IEEE Control Systems Magazine,2003,23 (2):20-23.
  • 3WIERING M,OTTERLO M V.Reinforcement learning state-of-the-art[M].Berlin:Springer-Verlag,2012:3-42.
  • 4SUTTON R S.Learning to predict by the methods of temporal differences[J].Machine Learning,1988,3(1):9-44.
  • 5CHEN Xingguo,GAO Yang,WANG Ruili.Online selective kernel-based temporal difference learning[J].IEEE Transactions on Neural Networks and Learning Systems,2013,24(12):1944-1956.
  • 6ZOU Bin,ZHANG Hai,XU Zongben.Learning from uniformly ergodic Markov chains[J].Journal of Complexity,2009,25(2):188-200.
  • 7YU Huizhen,BERTSEKAS D P.Convergence results for some temporal difference methods based on least squares[J].IEEE Transactions on Automatic Control,2009,54(7):1515-1531.
  • 8WATKINS C,DAYAN P.Q-learning[J].Machine Learning,1992,8(3):279-292.
  • 9CHEN Chunlin,DONG Daoyi,LI Hanxiong.Fidelitybased probabilistic Q-learning for control of quantum systems[J].IEEE Transactions on Neural Networks and Learning Systems,2014,25(5):920-933.
  • 10RUMMERY G,NIRANJAN M.On-line Q-learning using connectionist systems[D].Cambridge:University of Cambridge,1994.

共引文献79

同被引文献51

引证文献3

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部