验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [3]

作者

文献类型

期刊论文 [3]

学位论文 [1]

发表日期

语种

出处

IET CONTRO... [2]

NEURAL COM... [1]

资助项目

收录类别

SCI [3]

导师

资助机构

National N... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共4条，第1-4条

帮助

已选(0)清除条数/页：排序方式：
	Online reinforcement learning control by Bayesian inference 期刊论文 IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1331-1338 作者: Xia, Zhongpu; Zhao, Dongbin; Dongbin Zhao 浏览 \| Adobe PDF(1559Kb) \| 收藏 \| 浏览/下载：329/113 \| 提交时间：2016/06/15 Learning Systems Bayes Methods Gaussian Processes Optimal Control Online Reinforcement Learning Control Bayesian Inference Self-learning Control Probability Action Value Function Gaussian Process Bayesian-state-action-reward-state-action Algorithm
	连续状态系统的近似最优在线强化学习学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2015 作者: 朱圆恒 Adobe PDF(2679Kb) \| 收藏 \| 浏览/下载：485/0 \| 提交时间：2015/09/02 强化学习最优控制近似策略迭代概率近似最优连续状态系统收敛性在线学习 Kd树 Reinforcement Learning Optimal Control Approximate Policy Iteration Probably Approximately Correct Continuous-state System Convergence Online Learning Kd-tree
	Adaptive optimal control for a class of continuous-time affine nonlinear systems with unknown internal dynamics 期刊论文 NEURAL COMPUTING & APPLICATIONS, 2013, 卷号: 23, 期号: 7-8, 页码: 1843-1850 作者: Liu, Derong; Yang, Xiong; Li, Hongliang 浏览 \| Adobe PDF(527Kb) \| 收藏 \| 浏览/下载：307/108 \| 提交时间：2015/08/12 Adaptive Dynamic Programming Reinforcement Learning Policy Iteration Adaptive Optimal Control Neural Network Online Control Nonlinear System
	Neural-network-based online optimal control for uncertain non-linear continuous-time systems with control constraints 期刊论文 IET CONTROL THEORY AND APPLICATIONS, 2013, 卷号: 7, 期号: 17, 页码: 2037-2047 作者: Yang, Xiong; Liu, Derong; Huang, Yuzhu Adobe PDF(493Kb) \| 收藏 \| 浏览/下载：307/83 \| 提交时间：2015/08/12 Adaptive Control Approximation Theory Closed Loop Systems Continuous Time Systems Lyapunov Methods Neurocontrollers Nonlinear Control Systems Optimal Control Robust Control Uncertain Systems Neural Network-based Online Adaptive Optimal Control Uncertain Nonlinear Continuous-time Systems Control Constraints Infinite-horizon Optimal Control Problem Control Policy Saturation Constraints Identifier-critic Architecture Hamilton-jacobi-bellman Equation Approximation Uncertain System Dynamics Critic Nn Action-critic Dual Networks Reinforcement Learning Identifier Nn Policy Iteration Lyapunovaeuros Direct Method Closed Loop System Stability

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24467
全文量12297
访问量5009873
下载量798078

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495