期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
Optimal Policies for Quantum Markov Decision Processes 被引量:2
1
作者 ming-sheng ying Yuan Feng Sheng-Gang ying 《International Journal of Automation and computing》 EI CSCD 2021年第3期410-421,共12页
Markov decision process(MDP)offers a general framework for modelling sequential decision making where outcomes are random.In particular,it serves as a mathematical framework for reinforcement learning.This paper intro... Markov decision process(MDP)offers a general framework for modelling sequential decision making where outcomes are random.In particular,it serves as a mathematical framework for reinforcement learning.This paper introduces an extension of MDP,namely quantum MDP(q MDP),that can serve as a mathematical model of decision making about quantum systems.We develop dynamic programming algorithms for policy evaluation and finding optimal policies for q MDPs in the case of finite-horizon.The results obtained in this paper provide some useful mathematical tools for reinforcement learning techniques applied to the quantum world. 展开更多
关键词 Quantum Markov decision processes quantum machine learning reinforcement learning dynamic programming decision making
原文传递
并发行为推理的一种进程代数方法
2
作者 Yuan Feng ming-sheng ying 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第C00期23-23,共1页
在人工智能领域,动态系统的行为推理是一个非常热门的研究课题,其中最重要的问题是如何描述系统以及如何进行推理。在这一方面,人们已经提出很多形式化的方法。典型的描述动态系统的方法是引进一个取值随系统进化而改变的“事实”(fact... 在人工智能领域,动态系统的行为推理是一个非常热门的研究课题,其中最重要的问题是如何描述系统以及如何进行推理。在这一方面,人们已经提出很多形式化的方法。典型的描述动态系统的方法是引进一个取值随系统进化而改变的“事实”(fact)的集合,以及定义行为对“事实”的影响函数,以方便描述由执行特定的动作引起的状态转移;典型的推理问题是逻辑蕴涵,即寻找一种特定的适合描述动态系统的逻辑,在此逻辑下,系统状态的属性可以由有关系统的一些假设出发推导出来。 展开更多
关键词 进程代数 系统状态 动态系统 人工智能 推理 描述 逻辑蕴涵 行为 改变 并发
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部