深度强化学习综述:兼论计算机围棋的发展
赵冬斌; 邵坤; 朱圆恒; 李栋; 陈亚冉; 王海涛; 刘德荣; 周彤; 王成红
2016
发表期刊控制理论与应用
卷号33期号:6页码:701-717
其他摘要Deep reinforcement learning which incorporates both the advantages of the perception of deep learning and the decision making of reinforcement learning is able to output control signal directly based on input images. This mech-anism makes the artificial intelligence much close to human thinking modes. Deep reinforcement learning has achieved remarkable success in terms of theory and application since it is proposed. ‘Chuyihao–AlphaGo’, a computer Go deve-loped by Google DeepMind, based on deep reinforcement learning, beat the world’s top Go player Lee Sedol 4:1 in March 2016. This becomes a new milestone in artificial intelligence history. This paper surveys the development course of deep reinforcement learning, reviews the history of computer Go concurrently, analyzes the algorithms features, and discusses the research directions and application areas, in order to provide a valuable reference to the development of control theory and applications in a new direction.
关键词深度强化学习 初弈号 深度学习 强化学习 人工智能
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/15288
专题复杂系统管理与控制国家重点实验室_深度强化学习
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
赵冬斌,邵坤,朱圆恒,等. 深度强化学习综述:兼论计算机围棋的发展[J]. 控制理论与应用,2016,33(6):701-717.
APA 赵冬斌.,邵坤.,朱圆恒.,李栋.,陈亚冉.,...&王成红.(2016).深度强化学习综述:兼论计算机围棋的发展.控制理论与应用,33(6),701-717.
MLA 赵冬斌,et al."深度强化学习综述:兼论计算机围棋的发展".控制理论与应用 33.6(2016):701-717.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
深度强化学习综述:兼论计算机围棋的发展.(2816KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[赵冬斌]的文章
[邵坤]的文章
[朱圆恒]的文章
百度学术
百度学术中相似的文章
[赵冬斌]的文章
[邵坤]的文章
[朱圆恒]的文章
必应学术
必应学术中相似的文章
[赵冬斌]的文章
[邵坤]的文章
[朱圆恒]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 深度强化学习综述:兼论计算机围棋的发展.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。