CASIA OpenIR

浏览/检索结果: 共24条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Event-based input-constrained nonlinear H infinity state feedback with adaptive critic and neural implementation 期刊论文
NEUROCOMPUTING, 2016, 卷号: 214, 期号: *, 页码: 848-856
作者:  Wang, Ding;  Mu, Chaoxu;  Zhang, Qichao;  Liu, Derong
浏览  |  Adobe PDF(1090Kb)  |  收藏  |  浏览/下载:347/135  |  提交时间:2017/02/14
Adaptive Critic Learning (Acl)  Adaptive Dynamic Programming (Adp)  Event-based Control  Hamilton-jacobi-isaacs (Hji) Equation  Input Constraints  Neural Networks  Nonlinear H-infinity Control  State Feedback  
Model-free reinforcement learning for nonlinear zero-sum games with simultaneous explorations 会议论文
, Vancouver, Canada, 2016-7
作者:  Zhang, Qichao;  Zhao, Dongbin;  Zhu, Yuanheng;  Chen, Xi
浏览  |  Adobe PDF(339Kb)  |  收藏  |  浏览/下载:265/87  |  提交时间:2017/05/04
Model-Free Optimal Tracking Control via Critic-Only Q-Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2016, 卷号: 27, 期号: 10, 页码: 2134-2144
作者:  Luo, Biao;  Liu, Derong;  Huang, Tingwen;  Wang, Ding;  Luo,Biao
浏览  |  Adobe PDF(1521Kb)  |  收藏  |  浏览/下载:569/283  |  提交时间:2016/10/24
Critic-only Q-learning (Coql)  Model-free  Nonaffine Nonlinear Systems  Optimal Tracking Control  
Modeling and simulation of pedestrian dynamical behavior based on a fuzzy logic approach 期刊论文
INFORMATION SCIENCES, 2016, 卷号: 360, 期号: 0, 页码: 112-130
作者:  Zhou, Min;  Dong, Hairong;  Wang, Fei-Yue;  Wang, Qianling;  Yang, Xiaoxia
浏览  |  Adobe PDF(1954Kb)  |  收藏  |  浏览/下载:329/114  |  提交时间:2016/09/30
Pedestrian Dynamical Behavior  Modeling  Perceptual Information  Fuzzy Logic  Model Validation  
Online reinforcement learning control by Bayesian inference 期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1331-1338
作者:  Xia, Zhongpu;  Zhao, Dongbin;  Dongbin Zhao
浏览  |  Adobe PDF(1559Kb)  |  收藏  |  浏览/下载:339/113  |  提交时间:2016/06/15
Learning Systems  Bayes Methods  Gaussian Processes  Optimal Control  Online Reinforcement Learning Control  Bayesian Inference  Self-learning Control  Probability  Action Value Function  Gaussian Process  Bayesian-state-action-reward-state-action Algorithm  
Neural-Network-Based Distributed Adaptive Robust Control for a Class of Nonlinear Multiagent Systems With Time Delays and External Noises 期刊论文
IEEE TRANSACTIONS ON SYSTEMS MAN CYBERNETICS-SYSTEMS, 2016, 卷号: 46, 期号: 6, 页码: 750-758
作者:  Ma, Hongwen;  Wang, Zhuo;  Wang, Ding;  Liu, Derong;  Yan, Pengfei;  Wei, Qinglai
Adobe PDF(880Kb)  |  收藏  |  浏览/下载:342/134  |  提交时间:2016/09/30
Distributed Adaptive Robust Control  Multiagent Systems  Neural Networks (Nns)  Noises  Time Delay  
面向数据高效利用的深度强化学习方法及应用 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  王海涛
Adobe PDF(2611Kb)  |  收藏  |  浏览/下载:398/14  |  提交时间:2016/06/15
人工智能  强化学习  深度学习  经验回放  深度强化学习  数据采样  
基于数据的系统分析和自适应优化控制器设计 学位论文
, 北京: 中国科学院大学, 2016
作者:  阎鹏飞
Adobe PDF(2184Kb)  |  收藏  |  浏览/下载:292/4  |  提交时间:2016/06/21
基于数据的控制  自适应控制  自适应动态规划  增强学习  误差分析  
Autonomous Maneuvering Decision Research of UAV Based on Experience Knowledge Representation 会议论文
The 28th Chinese Control and Decision Conference, 宁夏银川, 2016/5/28-2016/5/30
作者:  He XM(贺雪梅);  Zu W(祖伟);  Chang HX(常红星);  Gao Y(高阳);  He XM(贺雪梅)
浏览  |  Adobe PDF(1617Kb)  |  收藏  |  浏览/下载:343/96  |  提交时间:2016/06/27
Experiential Knowledge  Bayes  Nash Equilibrium  Air Combat  
基于计算实验的区域路网交通信号控制研究 学位论文
, 北京: 中国科学院大学, 2016
作者:  刘裕良
Adobe PDF(5332Kb)  |  收藏  |  浏览/下载:214/2  |  提交时间:2016/06/27
计算实验  交通信号控制  区域路网  集成自适应动态规划