中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	A Linear Online Guided Policy Search Algorithm 会议论文 , Guangzhou, China, 2017 作者: Biao Sun; Fang-Zhou Xiong; Zhi-Yong Liu; Yang X(杨旭) Adobe PDF(417Kb) \| 收藏 \| 浏览/下载：247/61 \| 提交时间：2018/01/02
	深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文控制理论与应用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546 作者: 唐振韬; 邵坤; 赵冬斌; 朱圆恒 Adobe PDF(8232Kb) \| 收藏 \| 浏览/下载：214/33 \| 提交时间：2021/07/05 深度强化学习 AlphaGo Zero 深度学习强化学习人工智能

中国科学院自动化研究所机构知识库