CASIA OpenIR

浏览/检索结果: 共28条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
智能机器人共享控制与操作技能学习方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  席宝
Adobe PDF(9051Kb)  |  收藏  |  浏览/下载:319/20  |  提交时间:2021/02/01
位姿检测  共享控制  强化学习  策略梯度  示教引导  
Efficient cooperative structured control for a multi-joint biomimetic robotic fish 期刊论文
IEEE/ASME Transactions on Mechatronics, 2020, 卷号: 26, 期号: 5, 页码: 2506-2516
作者:  Yan Shuaizheng;  Wu Zhengxing;  Wang Jian;  Tan Min;  Yu Junzhi
Adobe PDF(2394Kb)  |  收藏  |  浏览/下载:65/20  |  提交时间:2023/05/31
Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256
作者:  Wei, Qinglai;  Wang, Lingxiao;  Liu, Yu;  Polycarpou, Marios M.
Adobe PDF(4019Kb)  |  收藏  |  浏览/下载:296/75  |  提交时间:2021/03/08
Elevators  Optimal control  Backpropagation  Machine learning  Neural networks  Learning (artificial intelligence)  Actor  –critic  adaptive dynamic programming  deep learning (DL)  elevator group control (EGC)  optimal control  reinforcement learning (RL)  
Continuous-Time Time-Varying Policy Iteration 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2020, 卷号: 50, 期号: 12, 页码: 4958-4971
作者:  Wei, Qinglai;  Liao, Zehua;  Yang, Zhanyu;  Li, Benkai;  Liu, Derong
Adobe PDF(3149Kb)  |  收藏  |  浏览/下载:238/49  |  提交时间:2021/03/02
Optimal control  Nonlinear systems  Time-varying systems  Mathematical model  Dynamic programming  Approximation algorithms  Iterative algorithms  Adaptive critic designs  adaptive dynamic programming (ADP)  neuro-dynamic programming  nonlinear systems  optimal control  policy iteration  
Wd3: Taming the estimation bias in deep reinforcement learning 会议论文
, Baltimore, MD, USA, 2020-12
作者:  He Q(何强);  Hou XW(侯新文)
Adobe PDF(2006Kb)  |  收藏  |  浏览/下载:173/33  |  提交时间:2022/06/27
deep reinforcement learning  estimation bias  neural networks  
Distill and Replay for Continual Language Learning 会议论文
, Barcelona, Spain (Online), 2020-12-8
作者:  Sun, Jingyuan;  Wang, Shaonan;  Zhang, Jiajun;  Zong, Chengqing
Adobe PDF(769Kb)  |  收藏  |  浏览/下载:181/51  |  提交时间:2021/06/28
Face Anti-Spoofing by Learning Polarization Cues in a Real-World Scenario 会议论文
, Chengdu, China, November 13 - 15, 2020
作者:  Tian, Yu;  Zhang, Kunbo;  Wang, Leyuan;  Sun, Zhenan
Adobe PDF(3838Kb)  |  收藏  |  浏览/下载:183/37  |  提交时间:2021/10/08
Stable Training of Bellman Error in Reinforcement Learning 会议论文
, Thailand, November 18–22
作者:  Gong C(龚晨);  Bai YP(白云鹏);  Hou XW(侯新文);  Ji XH(季晓慧)
Adobe PDF(2416Kb)  |  收藏  |  浏览/下载:86/28  |  提交时间:2023/06/27
Parallel Control for Optimal Tracking via Adaptive Dynamic Programming 期刊论文
IEEE-CAA JOURNAL OF AUTOMATICA SINICA, 2020, 卷号: 7, 期号: 6, 页码: 1662-1674
作者:  Lu, Jingwei;  Wei, Qinglai;  Wang, Fei-Yue
Adobe PDF(7214Kb)  |  收藏  |  浏览/下载:290/53  |  提交时间:2021/01/06
Adaptive dynamic programming (ADP)  nonlinear optimal control  parallel controller  parallel control theory  parallel system  tracking control  neural network (NN)  
基于模仿的机器人操作技能学习技术研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李博遥
Adobe PDF(6247Kb)  |  收藏  |  浏览/下载:336/14  |  提交时间:2020/08/27
机器人学习  模仿学习  深度强化学习  好奇心驱动探索  分层机制