期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
无界报酬折扣模型中ε(≥0)最优策略的性质
原文传递
导出
摘要
我们研究绝对平均相对有界折扣模型{S,(A(i),i∈S),q,r,V_(β)},其中S,A(i)(i∈S)均为可列集,q是时齐的,r满足(1)存在数集{r(i):r(i)>0,i∈S}使得■(2)存在数d>0,使得■以及V_(β)是折扣准则。本文证明的关键是我们引入了如下概念:在策略π下,于时刻n可达的状态;可实现的历史。
作者
董泽清
张升
机构地区
中国科学院应用数学研究所
云南大学数学系
出处
《科学通报》
1986年第7期557-557,共1页
Chinese Science Bulletin
关键词
最优策略
ε
无界报酬折扣模型
绝对平均相对有界折扣模型
分类号
O211 [理学—概率论与数理统计]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
0
共引文献
0
同被引文献
0
引证文献
0
二级引证文献
0
1
唐保祥.
离散函数与排列组合之关联探究[J]
.中学数学研究,2022(5):12-15.
2
郭义万,郭爽,郭婷婷,李欣.
读片窗答案[J]
.临床放射学杂志,2023,42(10):1698-1699.
3
董泽清,宋京生.
无界报酬半马氏折扣模型的初等方法[J]
.科学通报,1987(11):808-812.
被引量:1
4
李根.
集合中的新定义问题“揭秘”[J]
.中学生数理化(高一数学),2025(9):35-35.
5
董泽清,刘克.
折扣马尔可夫决策规划最优策略的结构[J]
.科学通报,1984(16):1021-1021.
6
刘建庸,刘克.
具有递归报酬函数的马氏决策规划[J]
.科学通报,1988(8):637-637.
7
曲开社.
有限群的正规π补[J]
.科学通报,1986(1):77-78.
8
王红旗,张超.
基于改进蜉蝣算法的多阈值图像分割[J]
.山西师范大学学报(自然科学版),2025,39(3):33-40.
9
张龄予,徐勐戬,赵坤.
单位四元数与三维球面[J]
.安庆师范大学学报(自然科学版),2025,31(2):6-11.
科学通报
1986年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部