期刊文献+

无界报酬折扣模型中ε(≥0)最优策略的性质

原文传递
导出
摘要 我们研究绝对平均相对有界折扣模型{S,(A(i),i∈S),q,r,V_(β)},其中S,A(i)(i∈S)均为可列集,q是时齐的,r满足(1)存在数集{r(i):r(i)>0,i∈S}使得■(2)存在数d>0,使得■以及V_(β)是折扣准则。本文证明的关键是我们引入了如下概念:在策略π下,于时刻n可达的状态;可实现的历史。
作者 董泽清 张升
出处 《科学通报》 1986年第7期557-557,共1页 Chinese Science Bulletin
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部