无界报酬折扣模型中ε(≥0)最优策略的性质

导出

摘要我们研究绝对平均相对有界折扣模型{S,(A(i),i∈S),q,r,V_(β)},其中S,A(i)(i∈S)均为可列集,q是时齐的,r满足(1)存在数集{r(i):r(i)>0,i∈S}使得■(2)存在数d>0,使得■以及V_(β)是折扣准则。本文证明的关键是我们引入了如下概念:在策略π下,于时刻n可达的状态;可实现的历史。

作者董泽清张升

机构地区中国科学院应用数学研究所云南大学数学系

出处《科学通报》 1986年第7期557-557,共1页 Chinese Science Bulletin

关键词最优策略 ε 无界报酬折扣模型绝对平均相对有界折扣模型

分类号 O211 [理学—概率论与数理统计]

引文网络
相关文献

1唐保祥.离散函数与排列组合之关联探究[J].中学数学研究,2022(5):12-15.
2郭义万,郭爽,郭婷婷,李欣.读片窗答案[J].临床放射学杂志,2023,42(10):1698-1699.
3董泽清,宋京生.无界报酬半马氏折扣模型的初等方法[J].科学通报,1987(11):808-812. 被引量：1
4李根.集合中的新定义问题“揭秘”[J].中学生数理化(高一数学),2025(9):35-35.
5董泽清,刘克.折扣马尔可夫决策规划最优策略的结构[J].科学通报,1984(16):1021-1021.
6刘建庸,刘克.具有递归报酬函数的马氏决策规划[J].科学通报,1988(8):637-637.
7曲开社.有限群的正规π补[J].科学通报,1986(1):77-78.
8王红旗,张超.基于改进蜉蝣算法的多阈值图像分割[J].山西师范大学学报(自然科学版),2025,39(3):33-40.
9张龄予,徐勐戬,赵坤.单位四元数与三维球面[J].安庆师范大学学报(自然科学版),2025,31(2):6-11.

科学通报

1986年第7期

浏览历史

内容加载中请稍等...

无界报酬折扣模型中ε(≥0)最优策略的性质

相关作者

相关机构

相关主题

浏览历史