CASIA OpenIR

Browse/Search Results:  1-10 of 24 Help

Selected(0)Clear Items/Page:    Sort:
Parallel Learning: Overview and Perspective for Computational Learning Across Syn2Real and Sim2Real 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 3, 页码: 603-631
Authors:  Qinghai Miao;  Yisheng Lv;  Min Huang;  Xiao Wang;  Fei-Yue Wang
Adobe PDF(11937Kb)  |  Favorite  |  View/Download:11/1  |  Submit date:2023/03/02
Machine learning  parallel learning  parallel systems  sim-to-real  syn-to-real  virtual-to-real  
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
Authors:  张丰一
Adobe PDF(16472Kb)  |  Favorite  |  View/Download:35/1  |  Submit date:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  戴星原
Adobe PDF(14868Kb)  |  Favorite  |  View/Download:140/7  |  Submit date:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
SURRL: Structural Unsupervised Representations for Robot Learning 期刊
创刊日期: 2022,
Sponsors:  Zhang FY(张丰一), Yurou Chen, Hong Qiao, Zhiyong Liu
Adobe PDF(7817Kb)  |  Favorite  |  View/Download:33/2  |  Submit date:2023/01/12
Reinforcement learning  structural representations learning  multi-task learning  robotics  
基于平行学习的混合智能调控方法与应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李小双
Adobe PDF(10128Kb)  |  Favorite  |  View/Download:105/7  |  Submit date:2022/06/20
平行学习  混合智能调控  示教数据  模仿学习  深度强化学习  
面向平行交通系统的城市出行轨迹挖掘方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李志帅
Adobe PDF(15178Kb)  |  Favorite  |  View/Download:126/9  |  Submit date:2022/06/16
平行交通系统  城市出行轨迹挖掘  出行语义感知  出行轨迹生成  疫情传播模拟  
基于元学习和强化学习的机器人操作视觉模仿技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李佳怡
Adobe PDF(33715Kb)  |  Favorite  |  View/Download:96/8  |  Submit date:2022/06/13
机器人操作学习  视觉模仿  元学习  强化学习  
Meta-Imitation Learning by Watching Video Demonstrations 会议论文
, 线上, 2022.4.25-2022.4.29
Authors:  Li, Jiayi;  Lu, Tao;  Cao, Xiaoge;  Cai, Yinghao;  Wang, Shuo
Adobe PDF(8968Kb)  |  Favorite  |  View/Download:80/14  |  Submit date:2022/06/14
Supervised assisted deep reinforcement learning for emergency voltage control of power systems 期刊论文
NEUROCOMPUTING, 2022, 卷号: 475, 页码: 69-79
Authors:  Li, Xiaoshuang;  Wang, Xiao;  Zheng, Xinhu;  Dai, Yuxin;  Yu, Zhihong;  Zhang, Jun Jason;  Bu, Guangquan;  Wang, Fei-Yue
Adobe PDF(2551Kb)  |  Favorite  |  View/Download:81/6  |  Submit date:2022/06/06
Deep reinforcement learning  Behavioral cloning  Dynamic demonstration  Emergency control  
SADRL: Merging human experience with machine intelligence via supervised assisted deep reinforcement learning 期刊论文
NEUROCOMPUTING, 2022, 卷号: 467, 页码: 300-309
Authors:  Li, Xiaoshuang;  Wang, Xiao;  Zheng, Xinhu;  Jin, Junchen;  Huang, Yanhao;  Zhang, Jun Jason;  Wang, Fei-Yue
Adobe PDF(1244Kb)  |  Favorite  |  View/Download:83/12  |  Submit date:2021/12/28
Deep reinforcement learning  Behavioral cloning  Dynamic demonstration  Double DQN