CASIA OpenIR

浏览/检索结果: 共14条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Online reinforcement learning control by Bayesian inference 期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1331-1338
作者:  Xia, Zhongpu;  Zhao, Dongbin;  Dongbin Zhao
浏览  |  Adobe PDF(1559Kb)  |  收藏  |  浏览/下载:337/113  |  提交时间:2016/06/15
Learning Systems  Bayes Methods  Gaussian Processes  Optimal Control  Online Reinforcement Learning Control  Bayesian Inference  Self-learning Control  Probability  Action Value Function  Gaussian Process  Bayesian-state-action-reward-state-action Algorithm  
面向数据高效利用的深度强化学习方法及应用 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  王海涛
Adobe PDF(2611Kb)  |  收藏  |  浏览/下载:398/14  |  提交时间:2016/06/15
人工智能  强化学习  深度学习  经验回放  深度强化学习  数据采样  
面向机动性和游速的小型机器鱼的设计与控制 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  张程
Adobe PDF(13375Kb)  |  收藏  |  浏览/下载:218/7  |  提交时间:2016/06/20
高游速  机动性  曲线拟合  偏心轮  粒子群  
基于数据的系统分析和自适应优化控制器设计 学位论文
, 北京: 中国科学院大学, 2016
作者:  阎鹏飞
Adobe PDF(2184Kb)  |  收藏  |  浏览/下载:292/4  |  提交时间:2016/06/21
基于数据的控制  自适应控制  自适应动态规划  增强学习  误差分析  
基于高斯过程的强化学习及汽车智能巡航控制 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  夏中谱
Adobe PDF(18177Kb)  |  收藏  |  浏览/下载:492/10  |  提交时间:2016/06/15
强化学习控制  高斯过程  连续状态系统  无模型控制  智能巡航控制  
汽车辅助驾驶系统中的单目视觉导航关键技术研究 学位论文
, 北京: 中国科学院大学, 2016
作者:  黄冠
Adobe PDF(2680Kb)  |  收藏  |  浏览/下载:351/9  |  提交时间:2016/06/28
汽车辅助驾驶系统、车道线检测、车辆检测、车辆跟踪、卷积神经网络  
自适应动态规划及其在多智能体中的应用 学位论文
, 北京: 中国科学院大学, 2016
作者:  林汉权
Adobe PDF(2636Kb)  |  收藏  |  浏览/下载:450/12  |  提交时间:2016/06/20
自适应动态规划  强化学习  多智能体  神经网络  高斯过程  
Big Data for Social Transportation 期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2016, 卷号: 17, 期号: 3, 页码: 620-630
作者:  Zheng, Xinhu;  Chen, Wei;  Wang, Pu;  Shen, Dayong;  Chen, Songhang;  Wang, Xiao;  Zhang, Qingpeng;  Yang, Liuqing
Adobe PDF(1913Kb)  |  收藏  |  浏览/下载:756/268  |  提交时间:2016/06/14
Big Data  Social Transportation  Intelligent Transportation System  Data Analytics  Crowdsourcing  
Experience Replay for Optimal Control of Nonzero-Sum Game Systems With Unknown Dynamics 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2016, 卷号: 46, 期号: 3, 页码: 854-865
作者:  Zhao, Dongbin;  Zhang, Qichao;  Wang, Ding;  Zhu, Yuanheng
Adobe PDF(1769Kb)  |  收藏  |  浏览/下载:492/191  |  提交时间:2016/06/14
Adaptive Dynamic Programming (Adp)  Experience Replay  Nonzero-sum (Nzs) Games  Optimal Control  Unknown Dynamics  
Urban Intelligent Parking System Based on the Parallel Theory 会议论文
IEEE International Conference on Computing, Networking and Communications, Kauai, Hawaii, USA, 2016.2.15-18
作者:  Wang, Fei-Yue;  Yang, Liu-Qing;  Yang, Jian;  Zhang, Yanli;  Han, Shuangshuang;  Zhao, Kai
Adobe PDF(387Kb)  |  收藏  |  浏览/下载:484/196  |  提交时间:2016/04/14