CASIA OpenIR

浏览/检索结果: 共13条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Conservative Policy Gradient in Multi-critic Setting 会议论文
, Hangzhou, China, 2019.11.22-24
作者:  Xi, Bao;  Wang, Rui;  Wang, Shuo;  Lu, Tao;  Cai, Yinghao
Adobe PDF(379Kb)  |  收藏  |  浏览/下载:217/74  |  提交时间:2021/02/02
inconsistancy  stablility  Q learning  policy gradient  
Curiosity-Driven Exploration for Off-Policy Reinforcement Learning Methods 会议论文
, Dali, China, 2019.12.06-2019.12.08
作者:  Li, Boyao;  Lu, Tao;  Li, Jiayi;  Lu, Ning;  Cai, Yinghao;  Wang, Shuo
浏览  |  Adobe PDF(2877Kb)  |  收藏  |  浏览/下载:207/73  |  提交时间:2020/08/27
An Automatic Robot Skills Learning System from Robot's Real-World Demonstrations 会议论文
, Nanchang, China, 2019.06.03-2019.06.05
作者:  Li, Boyao;  Lu, Tao;  Li, Xiaocan;  Cai, Yinghao;  Wang, Shuo
浏览  |  Adobe PDF(10072Kb)  |  收藏  |  浏览/下载:159/31  |  提交时间:2020/08/27
learn from demonstrations  simulation  real-world demonstrations  coordinate transformation  
Mixing Update Q-value for Deep Reinforcement Learning 会议论文
, Budapest, Hungary, 2019/7/14-19
作者:  Li Zhunan;  Hou Xinwen
浏览  |  Adobe PDF(468Kb)  |  收藏  |  浏览/下载:185/75  |  提交时间:2020/06/10
Autonomous Navigation with Improved Hierarchical Neural Network Based on Deep Reinforcement Learning 会议论文
, 中国 广州, 2019.07.27-2019.07.30
作者:  Zhang, Haiying;  Qiu, Tenghai;  Li, Shuxiao;  Zhu, Chengfei;  Lan, Xiaosong;  Chang, Hongxing
浏览  |  Adobe PDF(349Kb)  |  收藏  |  浏览/下载:305/98  |  提交时间:2020/06/09
Autonomous Navigation  DDPG  Improved Hierarchical Neural Network  Curriculum Learning  
Addressing Reward Engineering for Deep Reinforcement Learning on Multi-stage Task 会议论文
, Australia, 2019-12
作者:  Chen, Bin;  Su, Jianhua
浏览  |  Adobe PDF(1169Kb)  |  收藏  |  浏览/下载:328/86  |  提交时间:2020/06/08
From Rough to Precise: Human-Inspired Phased Target Learning Framework for Redundant Musculoskeletal Systems 期刊论文
FRONTIERS IN NEUROROBOTICS, 2019, 卷号: 13, 期号: 61, 页码: 14
作者:  Zhou, Junjie;  Chen, Jiahao;  Deng, Hu;  Qiao, Hong
Adobe PDF(3654Kb)  |  收藏  |  浏览/下载:369/44  |  提交时间:2019/12/16
musculoskeletal system  human-inspired motion learning  noise in nervous system  reinforcement learning  phased target learning  
平行学习理论及其在智能交通系统中的应用 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  林懿伦
Adobe PDF(17378Kb)  |  收藏  |  浏览/下载:435/4  |  提交时间:2019/07/15
平行学习  强化学习  深度学习  智能交通系统  
无权访问的条目 期刊论文
作者:  Xiong, Fangzhou;  Sun, Biao;  Yang, Xu;  Qiao, Hong;  Huang, Kaizhu;  Hussain, Amir;  Liu, Zhiyong
Adobe PDF(1059Kb)  |  收藏  |  浏览/下载:91/7  |  提交时间:2019/07/12
面向智能驾驶视觉控制的深度强化学习方法 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  李栋
Adobe PDF(6681Kb)  |  收藏  |  浏览/下载:340/11  |  提交时间:2019/06/27
深度强化学习  智能驾驶  视觉控制  目标检测  图注意力网络