CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Event-based input-constrained nonlinear H infinity state feedback with adaptive critic and neural implementation 期刊论文
NEUROCOMPUTING, 2016, 卷号: 214, 期号: *, 页码: 848-856
作者:  Wang, Ding;  Mu, Chaoxu;  Zhang, Qichao;  Liu, Derong
浏览  |  Adobe PDF(1090Kb)  |  收藏  |  浏览/下载:342/135  |  提交时间:2017/02/14
Adaptive Critic Learning (Acl)  Adaptive Dynamic Programming (Adp)  Event-based Control  Hamilton-jacobi-isaacs (Hji) Equation  Input Constraints  Neural Networks  Nonlinear H-infinity Control  State Feedback  
Data-based robust adaptive control for a class of unknown nonlinear constrained-input systems via integral reinforcement learning 期刊论文
INFORMATION SCIENCES, 2016, 卷号: 369, 页码: 731-747
作者:  Yang, Xiong;  Liu, Derong;  Luo, Biao;  Li, Chao
收藏  |  浏览/下载:213/0  |  提交时间:2016/12/26
Adaptive Dynamic Programming  Input Constraint  Neural Networks  Optimal Control  Reinforcement Learning  Robust Control  
Convolutional fitted Q iteration for vision-based control problems 会议论文
, Vancouver, BC, Canada, 24-29 July 2016
作者:  Zhao Dongbin;  Zhu Yuanheng;  Lv Le;  Chen Yaran;  Zhang Qichao
浏览  |  Adobe PDF(240Kb)  |  收藏  |  浏览/下载:336/115  |  提交时间:2017/05/08
Deep reinforcement learning with Experience Replay based on SARSA 会议论文
, *, 2016-9
作者:  Zhao,Dongbin(赵冬斌);  Wang,Haitao;  Shao,Kun;  Zhu,Yuanheng
浏览  |  Adobe PDF(1288Kb)  |  收藏  |  浏览/下载:383/172  |  提交时间:2018/01/04
Deep Learning  Reinforcement Learning  Experience Replay  q Learning  Sarsa Learning  
Using reinforcement learning techniques to solve continuous-time non-linear optimal tracking problem without system dynamics 期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1339-1347
作者:  Zhu, Yuanheng;  Zhao, Dongbin;  Li, Xiangjun
浏览  |  Adobe PDF(976Kb)  |  收藏  |  浏览/下载:375/161  |  提交时间:2016/12/26
Nonlinear Control Systems  Continuous Time Systems  Learning (Artificial Intelligence)  Optimal Control  Dynamic Programming  Lyapunov Methods  Linear Systems  Reinforcement Learning  Continuous-time Problem  Nonlinear Optimal Tracking Problem  Adaptive Dynamic Programming  Model-free Adaptive Optimal Tracking Algorithm  Lyapunov Analysis  Linear System  
人脸属性识别中的关键问题研究 学位论文
, 北京: 中国科学院大学, 2016
作者:  蔡利君
Adobe PDF(16166Kb)  |  收藏  |  浏览/下载:469/18  |  提交时间:2016/06/20
人脸属性识别  活体检测  年龄估计  表情识别  视线估计  指令选择  判别高斯过程隐变量模型  
面向数据高效利用的深度强化学习方法及应用 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  王海涛
Adobe PDF(2611Kb)  |  收藏  |  浏览/下载:397/14  |  提交时间:2016/06/15
人工智能  强化学习  深度学习  经验回放  深度强化学习  数据采样  
基于高斯过程的强化学习及汽车智能巡航控制 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  夏中谱
Adobe PDF(18177Kb)  |  收藏  |  浏览/下载:486/10  |  提交时间:2016/06/15
强化学习控制  高斯过程  连续状态系统  无模型控制  智能巡航控制  
自适应动态规划及其在多智能体中的应用 学位论文
, 北京: 中国科学院大学, 2016
作者:  林汉权
Adobe PDF(2636Kb)  |  收藏  |  浏览/下载:448/12  |  提交时间:2016/06/20
自适应动态规划  强化学习  多智能体  神经网络  高斯过程  
Value Iteration Adaptive Dynamic Programming for Optimal Control of Discrete-Time Nonlinear Systems 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2016, 卷号: 46, 期号: 3, 页码: 840-853
作者:  Wei, Qinglai;  Liu, Derong;  Lin, Hanquan;  Derong Liu
浏览  |  Adobe PDF(2015Kb)  |  收藏  |  浏览/下载:368/161  |  提交时间:2016/06/14
Adaptive Critic Designs  Adaptive Dynamic Programming (Adp)  Approximate Dynamic Programming  Neural Networks  Neuro-dynamic Programming  Optimal Control  Reinforcement Learning  Value Iteration