CASIA OpenIR

浏览/检索结果: 共68条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于深度强化学习的主动目标检测方法研究 学位论文
, 2022
作者:  许诺
Adobe PDF(9588Kb)  |  收藏  |  浏览/下载:272/16  |  提交时间:2022/12/19
目标检测  深度强化学习  主动目标检测  深度学习  
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
作者:  张丰一
Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:177/5  |  提交时间:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
A novel iterative adaptive critic design for smart home energy systems with solar energy 会议论文
, 中国厦门, 2022年11月
作者:  Liao ZH(廖泽华);  Wei, Qinglai;  Li, Hongyang
Adobe PDF(965Kb)  |  收藏  |  浏览/下载:145/69  |  提交时间:2023/06/06
Monte Carlo-based reinforcement learning control for unmanned aerial vehicle systems 期刊论文
NEUROCOMPUTING, 2022, 卷号: 507, 页码: 282-291
作者:  Wei, Qinglai;  Yang, Zesheng;  Su, Huaizhong;  Wang, Lijian
收藏  |  浏览/下载:201/0  |  提交时间:2022/09/19
Reinforcement learning  Adaptive dynamic programming (ADP)  UAV control  Monte Carlo simulation  Neural networks  
Dynamic-horizon model-based value estimation with latent imagination 期刊论文
IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14
作者:  Wang JJ(王俊杰);  Zhang QC(张启超);  Zhao DB(赵冬斌)
Adobe PDF(2305Kb)  |  收藏  |  浏览/下载:146/57  |  提交时间:2023/05/30
Latent world model  model-based value expansion (MVE)  reinforcement learning  reinforcement learning  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:278/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:175/67  |  提交时间:2023/07/06
HMDRL: Hierarchical Mixed Deep Reinforcement Learning to Balance Vehicle Supply and Demand 期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2022, 页码: 12
作者:  Xi, Jinhao;  Zhu, Fenghua;  Ye, Peijun;  Lv, Yisheng;  Tang, Haina;  Wang, Fei-Yue
Adobe PDF(3316Kb)  |  收藏  |  浏览/下载:245/30  |  提交时间:2022/09/19
deep reinforcement learning  online ride-hailing system  hierarchical repositioning framework  parallel coordination mechanism  mixed state  
Cooperative Multi-Agent Reinforcement Learning with Hypergraph Convolution 会议论文
, Padua, Italy, 18-23 July 2022
作者:  Yunpeng Bai;  Chen Gong;  Bin Zhang;  Guoliang Fan;  Xinwen Hou;  Yu Liu
Adobe PDF(8946Kb)  |  收藏  |  浏览/下载:98/31  |  提交时间:2023/06/14
Dynamic Event-Sampled Control of Interconnected Nonlinear Systems Using Reinforcement Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 页码: 15
作者:  Yang, Xiong;  Xu, Mengmeng;  Wei, Qinglai
收藏  |  浏览/下载:218/0  |  提交时间:2022/07/25
Asymptotic stability  Interconnected systems  Decentralized control  Closed loop systems  Artificial neural networks  Optimal control  Nonlinear dynamical systems  Adaptive dynamic programming (ADP)  decentralized control  event-based control  interconnected system  reinforcement learning (RL)