“机器智能、系统优化与最优决策”专刊前言
王成红; 孙长银; 苏剑波; 周彤; 赵东斌; 胡跃明
发表期刊控制理论与应用
2016
卷号33期号:12页码:1553-1554
其他摘要

       20163, 谷歌公司开发的计算机程序AlphaGo(初弈号)在韩国首都首尔挑战当今世界顶级棋手 —–韩国职业九段李世石(Lee Sedol), 并最终取得41负的令世界震惊战绩. 这标志着人工智能方法已经 能够在复杂的棋类博弈游戏中达到匹敌、甚至超越人类的水平. 其基本原理是将具有“感知”能力的深 度学习(deep learning)和具有“决策”能力的强化学习(reinforcement learning)紧密结合, 构成深度强化学 习(deep reinforcement learning)算法, 并与蒙特卡罗树搜索结合. 它极大地减少了目标优化过程的计算量, 提升了对棋局估计的准确度


;      In March 2016, AlphaGo, a computer program developed by Google Corporation, challenged Lee Sedol, Korea's top nine player in the Korean capital, to challenge the world record of 4-1 in Korea's capital Seoul This signifies that artificial intelligence methods have been able to match or even surpass humankind in complex chess game games whose basic principle is to combine deep learning with "perceived" abilities and "decision-making" abilities Reinforcement learning is tightly coupled to form a deep reinforcement learning algorithm that is combined with Monte Carlo tree search, which greatly reduces the computational complexity of the goal optimization process and improves the accuracy of the game estimate.
关键词机器智能 系统优化 最优决策
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/19324
专题多模态人工智能系统全国重点实验室_复杂系统智能机理与平行控制团队
推荐引用方式
GB/T 7714
王成红,孙长银,苏剑波,等. “机器智能、系统优化与最优决策”专刊前言[J]. 控制理论与应用,2016,33(12):1553-1554.
APA 王成红,孙长银,苏剑波,周彤,赵东斌,&胡跃明.(2016).“机器智能、系统优化与最优决策”专刊前言.控制理论与应用,33(12),1553-1554.
MLA 王成红,et al."“机器智能、系统优化与最优决策”专刊前言".控制理论与应用 33.12(2016):1553-1554.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
“机器智能、系统优化与最优决策”专刊前言(164KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[王成红]的文章
[孙长银]的文章
[苏剑波]的文章
百度学术
百度学术中相似的文章
[王成红]的文章
[孙长银]的文章
[苏剑波]的文章
必应学术
必应学术中相似的文章
[王成红]的文章
[孙长银]的文章
[苏剑波]的文章
相关权益政策
暂无数据
收藏/分享
文件名: “机器智能、系统优化与最优决策”专刊前言.pdf
格式: Adobe PDF
此文件暂不支持浏览
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。