CASIA OpenIR

浏览/检索结果: 共2条,第1-2条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
A Linear Online Guided Policy Search Algorithm 会议论文
, Guangzhou, China, 2017
作者:  Biao Sun;  Fang-Zhou Xiong;  Zhi-Yong Liu;  Yang X(杨旭)
Adobe PDF(417Kb)  |  收藏  |  浏览/下载:247/61  |  提交时间:2018/01/02
深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文
控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546
作者:  唐振韬;  邵 坤;  赵冬斌;  朱圆恒
Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:214/33  |  提交时间:2021/07/05
深度强化学习  AlphaGo Zero  深度学习  强化学习  人工智能