CASIA OpenIR

Browse/Search Results:  1-3 of 3 Help

Selected(0)Clear Items/Page:    Sort:
基于值分解优化的多智能体深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  王凌霄
Adobe PDF(13415Kb)  |  Favorite  |  View/Download:6/0  |  Submit date:2021/06/15
深度强化学习  多智能体系统  价值函数分解算法  图神经网络  
Discrete-Time Stable Generalized Self-Learning Optimal Control With Approximation Errors 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2018, 卷号: 29, 期号: 4, 页码: 1226-1238
Authors:  Wei, Qinglai;  Li, Benkai;  Song, Ruizhuo
View  |  Adobe PDF(2475Kb)  |  Favorite  |  View/Download:130/27  |  Submit date:2017/02/23
Adaptive Critic Designs  Adaptive Dynamic Programming (Adp)  Approximate Dynamic Programming  Generalized Policy Iteration (Gpi)  Neural Networks  Neurodynamic Programming  Nonlinear Systems  Optimal Control  Reinforcement Learning  
连续状态空间的强化学习问题 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
Authors:  何源
Adobe PDF(2826Kb)  |  Favorite  |  View/Download:296/0  |  Submit date:2015/09/02
强化学习  连续状态空间  核方法  函数逼近  Reinforcement Learning  Continuous State Space  Kernel Method  Function