中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

CASIA OpenIR

（本次检索基于用户作品认领结果）

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	Real-world Robot Reaching Skill Learning Based on Deep Reinforcement Learning 会议论文 , Hefei, China, 2020 作者: Liu, Naijun; Lu, Tao; Cai, Yinghao; Wang, Rui; Wang, Shuo 浏览 \| Adobe PDF(436Kb) \| 收藏 \| 浏览/下载：148/47 \| 提交时间：2020/09/27
	Conservative Policy Gradient in Multi-critic Setting 会议论文 , Hangzhou, China, 2019.11.22-24 作者: Xi, Bao; Wang, Rui; Wang, Shuo; Lu, Tao; Cai, Yinghao 浏览 \| Adobe PDF(379Kb) \| 收藏 \| 浏览/下载：186/63 \| 提交时间：2021/02/02 inconsistancy stablility Q learning policy gradient

中国科学院自动化研究所机构知识库