期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
深度强化学习进展:从AlphaGo到AlphaGo Zero 被引量:109
1
作者 唐振韬 邵坤 +1 位作者 赵冬斌 朱圆恒 《控制理论与应用》 EI CAS CSCD 北大核心 2017年第12期1529-1546,共18页
2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜Alpha... 2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜AlphaGo,再一次刷新人们对深度强化学习的认知.深度强化学习结合了深度学习和强化学习的优势,可以在复杂高维的状态动作空间中进行端到端的感知决策.本文主要介绍了从AlphaGo到AlphaGo Zero的深度强化学习的研究进展.首先回顾对深度强化学习的成功作出突出贡献的主要算法,包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展.然后给出AlphaGo Zero的详细介绍和讨论,分析其对人工智能的巨大推动作用.并介绍了深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域的应用进展,以及相关资源进展.最后探讨了深度强化学习的发展展望,以及对其他潜在领域的人工智能发展的启发意义. 展开更多
关键词 深度强化学习 alphago zero 深度学习 强化学习 人工智能
在线阅读 下载PDF
先天综合判断观照下的深度增强学习:以AlphaGo Zero为例 被引量:1
2
作者 郑炳楠 贺威 《南京林业大学学报(人文社会科学版)》 2019年第1期60-68,共9页
深度增强学习的出现引发了诸多关于人类思维与人工智能的思考。AlphaGo Zero的深度增强学习促使我们分析机器拥有先天综合知识的可能性。康德的先验感性综合理论对深度增强学习的观照体现在计算机的数学基础上,其感性纯直观中关于时间... 深度增强学习的出现引发了诸多关于人类思维与人工智能的思考。AlphaGo Zero的深度增强学习促使我们分析机器拥有先天综合知识的可能性。康德的先验感性综合理论对深度增强学习的观照体现在计算机的数学基础上,其感性纯直观中关于时间的部分与纯数学中的代数相对应,而二进制运算的过程体现了先天与经验的综合。先验知性综合理论对深度增强学习的观照体现于AlphaGo Zero围棋技能的获得过程。知性综合判断分为从简单到复杂的三个阶段,分别对应深度增强学习算法运行时由基础到综合的决策过程,从每个单位上的函数计算到函数之间组成的正负反馈,再到最终形成决策的通用智能,体现了这一程序在先天和经验上的综合性。然而,深度增强学习中很难存在先验理性。 展开更多
关键词 先天综合判断 深度增强学习 alphagozero 人工智能
在线阅读 下载PDF
新一代人工智能技术驱动下的新药研发 被引量:8
3
作者 吴昊 林铭 +2 位作者 孙懿 赵欣 蒲小平 《中国药理学通报》 CAS CSCD 北大核心 2019年第7期889-893,共5页
传统新药研发风险高而且周期长,资金投入也逐年增长,而人工智能(artificial intelligence,AI)技术可以改变传统新药研发模式,提高研发效率并降低再研成本。AI技术不仅能应用于靶点筛选,还能应用于表型筛选(phenotypic screening),从而... 传统新药研发风险高而且周期长,资金投入也逐年增长,而人工智能(artificial intelligence,AI)技术可以改变传统新药研发模式,提高研发效率并降低再研成本。AI技术不仅能应用于靶点筛选,还能应用于表型筛选(phenotypic screening),从而开展针对复杂疾病的新药研发,同时,小样本学习使得AI技术更加具有普适性。而AlphaGo Zero的出现为AI技术带来重大突破,将会推动新药研发的快速发展。 展开更多
关键词 新药研发 人工智能技术 靶点筛选 表型筛选 小样本学习 alphago zero
暂未订购
上一页 1 下一页 到第
使用帮助 返回顶部