CASIA OpenIR

Browse/Search Results:  1-10 of 104 Help

Selected(0)Clear Items/Page:    Sort:
Adaptive Critic Designs for Optimal Event-Driven Control of a CSTR System 期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2021, 卷号: 17, 期号: 1, 页码: 484-493
Authors:  Yang, Xiong;  Wei, Qinglai
Favorite  |  View/Download:5/0  |  Submit date:2021/01/06
Chemical reactors  Optimal control  Nonlinear systems  Adaptive systems  Cost function  Informatics  Closed loop systems  Adaptive critic designs (ACDs)  continuous stirred tank reactor (CSTR)  discounted cost  event-driven control  reinforcement learning (RL)  
智能机器人共享控制与操作技能学习方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  席宝
Adobe PDF(9051Kb)  |  Favorite  |  View/Download:45/6  |  Submit date:2021/02/01
位姿检测  共享控制  强化学习  策略梯度  示教引导  
基于模仿的机器人操作技能学习技术研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  李博遥
Adobe PDF(6247Kb)  |  Favorite  |  View/Download:90/4  |  Submit date:2020/08/27
机器人学习  模仿学习  深度强化学习  好奇心驱动探索  分层机制  
ACDER: Augmented Curiosity-Driven Experience Replay 会议论文
, Paris, France, 2020.05.31-2020.08.31
Authors:  Li, Boyao;  Lu, Tao;  Li, Jiayi;  Lu, Ning;  Cai, Yinghao;  Wang, Shuo
View  |  Adobe PDF(3303Kb)  |  Favorite  |  View/Download:85/30  |  Submit date:2020/08/27
Encoding Primitives Generation Policy Learning for Robotic Arm to Overcome Catastrophic Forgetting in Sequential Multi-tasks Learning 期刊论文
Neural Networks, 2020, 期号: 2020.06.003, 页码: 12
Authors:  Xiong, Fangzhou;  Liu, Zhiyong;  Huang, Kaizhu;  Yang, Xu;  Qiao, Hong;  Amir Hussain
View  |  Adobe PDF(646Kb)  |  Favorite  |  View/Download:46/1  |  Submit date:2020/06/09
Sequential multi-tasks learning, Continual learning, Catastrophic forgetting, Robotics  
Deep Reinforcement Learning-Based Automatic Exploration for Navigation in Unknown Environment 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 6, 页码: 2064-2076
Authors:  Li, Haoran;  Zhang, Qichao;  Zhao, Dongbin
View  |  Adobe PDF(4274Kb)  |  Favorite  |  View/Download:35/9  |  Submit date:2020/08/03
Robot sensing systems  Navigation  Entropy  Neural networks  Task analysis  Planning  Automatic exploration  deep reinforcement learning (DRL)  optimal decision  partial observation  
基于深度强化学习与力封闭融合的三指手机器人抓取方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  刘永乐
Adobe PDF(12619Kb)  |  Favorite  |  View/Download:76/3  |  Submit date:2020/06/18
机器人抓取  深度强化学习  力封闭  域随机化  
面向过盈配合微器件的机器人装配技能学习及其应用 学位论文
, 中科院自动化所: 中国科学院大学, 2020
Authors:  马燕芹
Adobe PDF(5940Kb)  |  Favorite  |  View/Download:86/8  |  Submit date:2020/06/11
精密装配  视觉测量  图像伺服控制  装配控制  强化学习  演示学习  装配技能学习  
基于混合更新Q值的深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  李主南
Adobe PDF(3839Kb)  |  Favorite  |  View/Download:63/2  |  Submit date:2020/06/10
深度强化学习  Q 学习算法  过估计  欠估计  Actor-Critic  凸组合  混合更新  
机器人持续性策略学习算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  熊方舟
Adobe PDF(3642Kb)  |  Favorite  |  View/Download:93/5  |  Submit date:2020/06/09
持续学习  策略学习  机器人  灾难性遗忘  状态基元