中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

CASIA OpenIR

（本次检索基于用户作品认领结果）

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	Conservative Policy Gradient in Multi-critic Setting 会议论文 , Hangzhou, China, 2019.11.22-24 作者: Xi, Bao; Wang, Rui; Wang, Shuo; Lu, Tao; Cai, Yinghao 浏览 \| Adobe PDF(379Kb) \| 收藏 \| 浏览/下载：213/72 \| 提交时间：2021/02/02 inconsistancy stablility Q learning policy gradient
	Curiosity-Driven Exploration for Off-Policy Reinforcement Learning Methods 会议论文 , Dali, China, 2019.12.06-2019.12.08 作者: Li, Boyao; Lu, Tao; Li, Jiayi; Lu, Ning; Cai, Yinghao; Wang, Shuo 浏览 \| Adobe PDF(2877Kb) \| 收藏 \| 浏览/下载：205/71 \| 提交时间：2020/08/27

中国科学院自动化研究所机构知识库