期刊文献+

机器人足球赛中基于增强学习的任务分工 被引量:9

ROLE DIVERSITY IN ROBOT SOCCER BASED ON REINFORCEMENT LEARNING
在线阅读 下载PDF
导出
摘要 本文研究了机器人足球赛中利用增强学习进行角色分工的问题 ,通过仿真试验和理论分析 ,指出文 [1]中采取无限作用范围衰减奖励优化模型 ( infinite- horizon discounted model)的 Q学习算法对该任务不合适 ,并用平均奖励模型 ( average- reward model)对算法进行了改进 ,实验表明改进后学习的收敛速度以及系统的性能都提高了近一倍 . In this paper, the role diversity based on reinforcement learning in robot soccer is studied. Through simulation and analysis, it is shown that the Q algorithm infinite horizon discounted model in \ is not suitable to this task. Instead of that, average reward model is used for improving the algorithm. Simulation experiments show that the convergence rate in learning and the system performance are twice increased after improvement.
出处 《机器人》 EI CSCD 北大核心 2000年第6期482-489,共8页 Robot
基金 86 3项目!(86 3- 5 12 - 980 5 - 18) 国家自然科学基金!(6 98895 0 1)
关键词 机器人足球赛 增强学习 Q算法 任务分工 Q algorithm, infinite horizon discounted model, average reward model
  • 相关文献

参考文献3

  • 1[1]Tucker Balch. Learning Roles: Behavioral Diversity in Robot Teams. In AAAI-97 Workshop on Multiagent Learning.Providence, R.I, 1997
  • 2[2]Christopher J C H Watkins. Technical Note:Q-Learning. Machine Learning, 1992,8: 279-292
  • 3[3]Leslie Pack Kaelbling, Michael L Littman. Reinforcement Learning: A Survey. Journal of Artificial IntelligenceResearch 1996,4: 237-285

同被引文献69

引证文献9

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部