深度强化学习综述:兼论计算机围棋的发展 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717
Authors:  赵冬斌;  邵坤;  朱圆恒;  李栋;  陈亚冉;  王海涛;  刘德荣;  周彤;  王成红
控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717
深度强化学习  初弈号  深度学习  强化学习  人工智能  
概率近似正确的强化学习算法解决连续状态空间控制问题 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 12, 页码: 1603-1613
Authors:  朱圆恒;  赵冬斌
控制理论与应用, 2016, 卷号: 33, 期号: 12, 页码: 1603-1613
强化学习  概率近似正确  Kd树  双连杆机械臂  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
Authors:  朱圆恒
中国科学院自动化研究所: 中国科学院大学, 2015
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree