期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
深度强化学习进展:从AlphaGo到AlphaGo Zero
被引量:
109
1
作者
唐振韬
邵坤
+1 位作者
赵冬斌
朱圆恒
《控制理论与应用》
EI
CAS
CSCD
北大核心
2017年第12期1529-1546,共18页
2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜Alpha...
2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜AlphaGo,再一次刷新人们对深度强化学习的认知.深度强化学习结合了深度学习和强化学习的优势,可以在复杂高维的状态动作空间中进行端到端的感知决策.本文主要介绍了从AlphaGo到AlphaGo Zero的深度强化学习的研究进展.首先回顾对深度强化学习的成功作出突出贡献的主要算法,包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展.然后给出AlphaGo Zero的详细介绍和讨论,分析其对人工智能的巨大推动作用.并介绍了深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域的应用进展,以及相关资源进展.最后探讨了深度强化学习的发展展望,以及对其他潜在领域的人工智能发展的启发意义.
展开更多
关键词
深度强化学习
alphago
zero
深度学习
强化学习
人工智能
在线阅读
下载PDF
职称材料
先天综合判断观照下的深度增强学习:以AlphaGo Zero为例
被引量:
1
2
作者
郑炳楠
贺威
《南京林业大学学报(人文社会科学版)》
2019年第1期60-68,共9页
深度增强学习的出现引发了诸多关于人类思维与人工智能的思考。AlphaGo Zero的深度增强学习促使我们分析机器拥有先天综合知识的可能性。康德的先验感性综合理论对深度增强学习的观照体现在计算机的数学基础上,其感性纯直观中关于时间...
深度增强学习的出现引发了诸多关于人类思维与人工智能的思考。AlphaGo Zero的深度增强学习促使我们分析机器拥有先天综合知识的可能性。康德的先验感性综合理论对深度增强学习的观照体现在计算机的数学基础上,其感性纯直观中关于时间的部分与纯数学中的代数相对应,而二进制运算的过程体现了先天与经验的综合。先验知性综合理论对深度增强学习的观照体现于AlphaGo Zero围棋技能的获得过程。知性综合判断分为从简单到复杂的三个阶段,分别对应深度增强学习算法运行时由基础到综合的决策过程,从每个单位上的函数计算到函数之间组成的正负反馈,再到最终形成决策的通用智能,体现了这一程序在先天和经验上的综合性。然而,深度增强学习中很难存在先验理性。
展开更多
关键词
先天综合判断
深度增强学习
alphago
zero
人工智能
在线阅读
下载PDF
职称材料
新一代人工智能技术驱动下的新药研发
被引量:
8
3
作者
吴昊
林铭
+2 位作者
孙懿
赵欣
蒲小平
《中国药理学通报》
CAS
CSCD
北大核心
2019年第7期889-893,共5页
传统新药研发风险高而且周期长,资金投入也逐年增长,而人工智能(artificial intelligence,AI)技术可以改变传统新药研发模式,提高研发效率并降低再研成本。AI技术不仅能应用于靶点筛选,还能应用于表型筛选(phenotypic screening),从而...
传统新药研发风险高而且周期长,资金投入也逐年增长,而人工智能(artificial intelligence,AI)技术可以改变传统新药研发模式,提高研发效率并降低再研成本。AI技术不仅能应用于靶点筛选,还能应用于表型筛选(phenotypic screening),从而开展针对复杂疾病的新药研发,同时,小样本学习使得AI技术更加具有普适性。而AlphaGo Zero的出现为AI技术带来重大突破,将会推动新药研发的快速发展。
展开更多
关键词
新药研发
人工智能技术
靶点筛选
表型筛选
小样本学习
alphago
zero
暂未订购
题名
深度强化学习进展:从AlphaGo到AlphaGo Zero
被引量:
109
1
作者
唐振韬
邵坤
赵冬斌
朱圆恒
机构
中国科学院自动化研究所
中国科学院大学
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2017年第12期1529-1546,共18页
基金
国家自然科学基金项目(61603382,61573353,61533017)资助~~
文摘
2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜AlphaGo,再一次刷新人们对深度强化学习的认知.深度强化学习结合了深度学习和强化学习的优势,可以在复杂高维的状态动作空间中进行端到端的感知决策.本文主要介绍了从AlphaGo到AlphaGo Zero的深度强化学习的研究进展.首先回顾对深度强化学习的成功作出突出贡献的主要算法,包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展.然后给出AlphaGo Zero的详细介绍和讨论,分析其对人工智能的巨大推动作用.并介绍了深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域的应用进展,以及相关资源进展.最后探讨了深度强化学习的发展展望,以及对其他潜在领域的人工智能发展的启发意义.
关键词
深度强化学习
alphago
zero
深度学习
强化学习
人工智能
Keywords
deep reinforcement learning
alphago zero
deep learning
reinforcement learning
artificial intelligence
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
先天综合判断观照下的深度增强学习:以AlphaGo Zero为例
被引量:
1
2
作者
郑炳楠
贺威
机构
南京大学
厦门大学
出处
《南京林业大学学报(人文社会科学版)》
2019年第1期60-68,共9页
文摘
深度增强学习的出现引发了诸多关于人类思维与人工智能的思考。AlphaGo Zero的深度增强学习促使我们分析机器拥有先天综合知识的可能性。康德的先验感性综合理论对深度增强学习的观照体现在计算机的数学基础上,其感性纯直观中关于时间的部分与纯数学中的代数相对应,而二进制运算的过程体现了先天与经验的综合。先验知性综合理论对深度增强学习的观照体现于AlphaGo Zero围棋技能的获得过程。知性综合判断分为从简单到复杂的三个阶段,分别对应深度增强学习算法运行时由基础到综合的决策过程,从每个单位上的函数计算到函数之间组成的正负反馈,再到最终形成决策的通用智能,体现了这一程序在先天和经验上的综合性。然而,深度增强学习中很难存在先验理性。
关键词
先天综合判断
深度增强学习
alphago
zero
人工智能
Keywords
innate comprehensive judgment
deep reinforcement learning
alphago zero
artificial intelligence
分类号
B516.31 [哲学宗教—外国哲学]
在线阅读
下载PDF
职称材料
题名
新一代人工智能技术驱动下的新药研发
被引量:
8
3
作者
吴昊
林铭
孙懿
赵欣
蒲小平
机构
北京大学药学院分子与细胞药理学系
出处
《中国药理学通报》
CAS
CSCD
北大核心
2019年第7期889-893,共5页
基金
“十三五”国家科技重大新药创制项目(No 2017ZX09101003-009-006)
国家自然科学基金资助项目(No U1603128)
文摘
传统新药研发风险高而且周期长,资金投入也逐年增长,而人工智能(artificial intelligence,AI)技术可以改变传统新药研发模式,提高研发效率并降低再研成本。AI技术不仅能应用于靶点筛选,还能应用于表型筛选(phenotypic screening),从而开展针对复杂疾病的新药研发,同时,小样本学习使得AI技术更加具有普适性。而AlphaGo Zero的出现为AI技术带来重大突破,将会推动新药研发的快速发展。
关键词
新药研发
人工智能技术
靶点筛选
表型筛选
小样本学习
alphago
zero
Keywords
new drug research and development
AI technology
target screening
phenotypic screening
one-shot learning
alphago zero
分类号
R-05 [医药卫生]
R319 [医药卫生—基础医学]
暂未订购
题名
作者
出处
发文年
被引量
操作
1
深度强化学习进展:从AlphaGo到AlphaGo Zero
唐振韬
邵坤
赵冬斌
朱圆恒
《控制理论与应用》
EI
CAS
CSCD
北大核心
2017
109
在线阅读
下载PDF
职称材料
2
先天综合判断观照下的深度增强学习:以AlphaGo Zero为例
郑炳楠
贺威
《南京林业大学学报(人文社会科学版)》
2019
1
在线阅读
下载PDF
职称材料
3
新一代人工智能技术驱动下的新药研发
吴昊
林铭
孙懿
赵欣
蒲小平
《中国药理学通报》
CAS
CSCD
北大核心
2019
8
暂未订购
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部