CASIA OpenIR

浏览/检索结果: 共21条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Dynamic-horizon model-based value estimation with latent imagination 期刊论文
IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14
作者:  Wang JJ(王俊杰);  Zhang QC(张启超);  Zhao DB(赵冬斌)
Adobe PDF(2305Kb)  |  收藏  |  浏览/下载:160/59  |  提交时间:2023/05/30
Latent world model  model-based value expansion (MVE)  reinforcement learning  reinforcement learning  
Empirical Policy Optimization for n-Player Markov Games 期刊论文
IEEE Transactions on Cybernetics, 2022, 页码: doi={10.1109/TCYB.2022.3179775}
作者:  Yuanheng Zhu;  Weifan Li;  Mengchen Zhao;  Jianye Hao;  Dongbin Zhao
Adobe PDF(1739Kb)  |  收藏  |  浏览/下载:95/38  |  提交时间:2023/04/26
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:285/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
HMDRL: Hierarchical Mixed Deep Reinforcement Learning to Balance Vehicle Supply and Demand 期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2022, 页码: 12
作者:  Xi, Jinhao;  Zhu, Fenghua;  Ye, Peijun;  Lv, Yisheng;  Tang, Haina;  Wang, Fei-Yue
Adobe PDF(3316Kb)  |  收藏  |  浏览/下载:263/30  |  提交时间:2022/09/19
deep reinforcement learning  online ride-hailing system  hierarchical repositioning framework  parallel coordination mechanism  mixed state  
Efficient Exploration for Multi-Agent Reinforcement Learning via Transferable Successor Features 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 9, 页码: 1673-1686
作者:  Wenzhang Liu;  Lu Dong;  Dan Niu;  Changyin Sun
Adobe PDF(5554Kb)  |  收藏  |  浏览/下载:155/69  |  提交时间:2022/08/19
Knowledge transfer  multi-agent systems  reinforcement learning  successor features  
Reinforcement Learning Behavioral Control for Nonlinear Autonomous System 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 9, 页码: 1561-1573
作者:  Zhenyi Zhang;  Zhibin Mo;  Yutao Chen;  Jie Huang
Adobe PDF(2249Kb)  |  收藏  |  浏览/下载:125/31  |  提交时间:2022/08/19
Behavioral control  mission supervisor  nonlinear autonomous system  reinforcement learning  
Visuals to Text: A Comprehensive Review on Automatic Image Captioning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 8, 页码: 1339-1365
作者:  Yue Ming;  Nannan Hu;  Chunxiao Fan;  Fan Feng;  Jiangwan Zhou;  Hui Yu
Adobe PDF(56128Kb)  |  收藏  |  浏览/下载:165/21  |  提交时间:2022/08/01
Artificial intelligence  attention mechanism  encoder-decoder framework  image captioning  multi-modal understanding  training strategies  
Discounted Iterative Adaptive Critic Designs With Novel Stability Analysis for Tracking Control 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 7, 页码: 1262-1272
作者:  Mingming Ha;  Ding Wang;  Derong Liu
Adobe PDF(1832Kb)  |  收藏  |  浏览/下载:218/72  |  提交时间:2022/06/27
Adaptive critic design  adaptive dynamic programming (ADP)  approximate dynamic programming  discrete-time nonlinear systems  reinforcement learning  stability analysis  tracking control  value iteration (VI)  
Towards Long Lifetime Battery: AI-Based Manufacturing and Management 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 7, 页码: 1139-1165
作者:  Kailong Liu;  Zhongbao Wei;  Chenghui Zhang;  Yunlong Shang;  Remus Teodorescu;  Qing-Long Han
Adobe PDF(10020Kb)  |  收藏  |  浏览/下载:172/28  |  提交时间:2022/06/27
Artificial intelligence  battery health management  battery life diagnostic  battery manufacturing  smart battery  
基于自适应动态规划的分布式迭代控制方法研究 学位论文
工学博士, 人工智能学院: 中国科学院大学, 2022
作者:  李洪阳
Adobe PDF(3786Kb)  |  收藏  |  浏览/下载:281/26  |  提交时间:2022/06/14
自适应动态规划,最优控制,分布式控制,智能控制,强化学习