CASIA OpenIR

Browse/Search Results:  1-5 of 5 Help

Selected(0)Clear Items/Page:    Sort:
基于高斯过程的强化学习及汽车智能巡航控制 学位论文
, 北京: 中国科学院研究生院, 2016
Authors:  夏中谱
Adobe PDF(18177Kb)  |  Favorite  |  View/Download:186/8  |  Submit date:2016/06/15
强化学习控制  高斯过程  连续状态系统  无模型控制  智能巡航控制  
自适应动态规划及其在多智能体中的应用 学位论文
, 北京: 中国科学院大学, 2016
Authors:  林汉权
Adobe PDF(2636Kb)  |  Favorite  |  View/Download:183/9  |  Submit date:2016/06/20
自适应动态规划  强化学习  多智能体  神经网络  高斯过程  
深度强化学习综述:兼论计算机围棋的发展 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717
Authors:  赵冬斌;  邵坤;  朱圆恒;  李栋;  陈亚冉;  王海涛;  刘德荣;  周彤;  王成红
View  |  Adobe PDF(2816Kb)  |  Favorite  |  View/Download:485/198  |  Submit date:2017/09/13
深度强化学习  初弈号  深度学习  强化学习  人工智能  
概率近似正确的强化学习算法解决连续状态空间控制问题 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 12, 页码: 1603-1613
Authors:  朱圆恒;  赵冬斌
View  |  Adobe PDF(1544Kb)  |  Favorite  |  View/Download:33/6  |  Submit date:2017/09/13
强化学习  概率近似正确  Kd树  双连杆机械臂  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
Authors:  朱圆恒
Adobe PDF(2679Kb)  |  Favorite  |  View/Download:240/0  |  Submit date:2015/09/02
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree