CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
深度强化学习综述:兼论计算机围棋的发展 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717
作者:  赵冬斌;  邵坤;  朱圆恒;  李栋;  陈亚冉;  王海涛;  刘德荣;  周彤;  王成红
浏览  |  Adobe PDF(2816Kb)  |  收藏  |  浏览/下载:1720/634  |  提交时间:2017/09/13
深度强化学习  初弈号  深度学习  强化学习  人工智能  
Neural-network-based robust optimal control of uncertain nonlinear systems using model-free policy iteration algorithm 会议论文
, Vancouver, BC, Canada, 24-29 July 2016
作者:  Li, Chao;  Wang, Ding;  Liu, Derong
浏览  |  Adobe PDF(201Kb)  |  收藏  |  浏览/下载:215/74  |  提交时间:2017/05/03
Model-Free Optimal Tracking Control via Critic-Only Q-Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2016, 卷号: 27, 期号: 10, 页码: 2134-2144
作者:  Luo, Biao;  Liu, Derong;  Huang, Tingwen;  Wang, Ding;  Luo,Biao
浏览  |  Adobe PDF(1521Kb)  |  收藏  |  浏览/下载:565/283  |  提交时间:2016/10/24
Critic-only Q-learning (Coql)  Model-free  Nonaffine Nonlinear Systems  Optimal Tracking Control  
Data-based robust optimal control of continuous-time affine nonlinear systems with matched uncertainties 期刊论文
INFORMATION SCIENCES, 2016, 期号: 366, 页码: 121-133
作者:  Wang, Ding;  Li, Chao;  Liu, Derong;  Mu, Chaoxu
浏览  |  Adobe PDF(782Kb)  |  收藏  |  浏览/下载:464/186  |  提交时间:2016/10/20
Adaptive Dynamic Programming  Data-based Control  Integral Policy Iteration  Matched Uncertainties  Neural Networks  Robust Optimal Control  
压电陶瓷执行器的智能预测控制方法研究 学位论文
, 北京: 中国科学院大学, 2016
作者:  刘伟川
Adobe PDF(17578Kb)  |  收藏  |  浏览/下载:490/5  |  提交时间:2016/06/22
压电陶瓷执行器  微动平台  迟滞非线性  神经网络  模糊系统  预 测控制  粘滞-滑动  
基于数据的系统分析和自适应优化控制器设计 学位论文
, 北京: 中国科学院大学, 2016
作者:  阎鹏飞
Adobe PDF(2184Kb)  |  收藏  |  浏览/下载:290/4  |  提交时间:2016/06/21
基于数据的控制  自适应控制  自适应动态规划  增强学习  误差分析  
自主空中加油的目标视觉检测与跟踪策略研究 学位论文
, 北京: 中国科学院大学, 2016
作者:  尹英杰
Adobe PDF(9463Kb)  |  收藏  |  浏览/下载:387/10  |  提交时间:2016/06/20
离线有监督学习  在线学习  视觉检测  视觉跟踪  检测器和跟踪器融合机制  自主对接控制  自主空中加油  
自适应动态规划及其在多智能体中的应用 学位论文
, 北京: 中国科学院大学, 2016
作者:  林汉权
Adobe PDF(2636Kb)  |  收藏  |  浏览/下载:448/12  |  提交时间:2016/06/20
自适应动态规划  强化学习  多智能体  神经网络  高斯过程  
Online reinforcement learning control by Bayesian inference 期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1331-1338
作者:  Xia, Zhongpu;  Zhao, Dongbin;  Dongbin Zhao
浏览  |  Adobe PDF(1559Kb)  |  收藏  |  浏览/下载:329/113  |  提交时间:2016/06/15
Learning Systems  Bayes Methods  Gaussian Processes  Optimal Control  Online Reinforcement Learning Control  Bayesian Inference  Self-learning Control  Probability  Action Value Function  Gaussian Process  Bayesian-state-action-reward-state-action Algorithm  
A neural-network-based online optimal control approach for nonlinear robust decentralized stabilization 期刊论文
SOFT COMPUTING, 2016, 卷号: 20, 期号: 2, 页码: 707-716
作者:  Wang, Ding;  Liu, Derong;  Li, Hongliang;  Ma, Hongwen;  Li, Chao
Adobe PDF(837Kb)  |  收藏  |  浏览/下载:304/67  |  提交时间:2016/06/14
Adaptive Dynamic Programming  Approximate Dynamic Programming  Neural Networks  Online Optimal Control  Robust Decentralized Stabilization  Uncertain Nonlinear Systems