CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共3条,第1-3条 帮助

限定条件            
已选(0)清除 条数/页:   排序方式:
Programming by Visual Demonstration for Pick-and-Place Tasks using Robot Skills 会议论文
, 云南大理, 2019-12-06
作者:  Hao P(郝鹏);  Lu T(鲁涛);  Cai YH(蔡莹皓);  Wang S(王硕)
Adobe PDF(1297Kb)  |  收藏  |  浏览/下载:197/51  |  提交时间:2023/02/08
Conservative Policy Gradient in Multi-critic Setting 会议论文
, Hangzhou, China, 2019.11.22-24
作者:  Xi, Bao;  Wang, Rui;  Wang, Shuo;  Lu, Tao;  Cai, Yinghao
浏览  |  Adobe PDF(379Kb)  |  收藏  |  浏览/下载:228/77  |  提交时间:2021/02/02
inconsistancy  stablility  Q learning  policy gradient  
Curiosity-Driven Exploration for Off-Policy Reinforcement Learning Methods 会议论文
, Dali, China, 2019.12.06-2019.12.08
作者:  Li, Boyao;  Lu, Tao;  Li, Jiayi;  Lu, Ning;  Cai, Yinghao;  Wang, Shuo
浏览  |  Adobe PDF(2877Kb)  |  收藏  |  浏览/下载:209/73  |  提交时间:2020/08/27