×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系统全... [4]
毕业生 [3]
复杂系统认知与决策实... [1]
作者
杨雄 [2]
朱圆恒 [2]
张杰 [1]
秦蕊 [1]
曾大军 [1]
黄文振 [1]
更多...
文献类型
期刊论文 [5]
学位论文 [3]
发表日期
2023 [1]
2021 [1]
2016 [1]
2015 [1]
2014 [1]
2013 [1]
更多...
语种
英语 [5]
中文 [3]
出处
IET CONTRO... [2]
COMPLEX & ... [1]
DECISION S... [1]
IEEE TRANS... [1]
资助项目
National K... [1]
National N... [1]
National N... [1]
National N... [1]
This work ... [1]
收录类别
SCI [5]
SSCI [1]
导师
张文生 [1]
易建强 [1]
赵冬斌 [1]
资助机构
61533017) [1]
61573353 [1]
Beiing Nov... [1]
National K... [1]
National N... [1]
National N... [1]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共8条,第1-8条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
题名升序
题名降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
Data-efficient model-based reinforcement learning with trajectory discrimination
期刊论文
COMPLEX & INTELLIGENT SYSTEMS, 2023, 页码: 10
作者:
Qu, Tuo
;
Duan, Fuqing
;
Zhang, Junge
;
Zhao, Bo
;
Huang, Wenzhen
收藏
  |  
浏览/下载:126/0
  |  
提交时间:2023/11/16
Reinforcement learning
Deep learning
Continuous control task
World model
Adaptive Critic Designs for Optimal Event-Driven Control of a CSTR System
期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2021, 卷号: 17, 期号: 1, 页码: 484-493
作者:
Yang, Xiong
;
Wei, Qinglai
收藏
  |  
浏览/下载:182/0
  |  
提交时间:2021/01/06
Chemical reactors
Optimal control
Nonlinear systems
Adaptive systems
Cost function
Informatics
Closed loop systems
Adaptive critic designs (ACDs)
continuous stirred tank reactor (CSTR)
discounted cost
event-driven control
reinforcement learning (RL)
Using reinforcement learning techniques to solve continuous-time non-linear optimal tracking problem without system dynamics
期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1339-1347
作者:
Zhu, Yuanheng
;
Zhao, Dongbin
;
Li, Xiangjun
Adobe PDF(976Kb)
  |  
收藏
  |  
浏览/下载:440/178
  |  
提交时间:2016/12/26
Nonlinear Control Systems
Continuous Time Systems
Learning (Artificial Intelligence)
Optimal Control
Dynamic Programming
Lyapunov Methods
Linear Systems
Reinforcement Learning
Continuous-time Problem
Nonlinear Optimal Tracking Problem
Adaptive Dynamic Programming
Model-free Adaptive Optimal Tracking Algorithm
Lyapunov Analysis
Linear System
连续状态空间的强化学习问题
学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
作者:
何源
Adobe PDF(2826Kb)
  |  
收藏
  |  
浏览/下载:436/0
  |  
提交时间:2015/09/02
强化学习
连续状态空间
核方法
函数逼近
Reinforcement Learning
Continuous State Space
Kernel Method
Function
连续状态系统的近似最优在线强化学习
学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:
朱圆恒
Adobe PDF(2679Kb)
  |  
收藏
  |  
浏览/下载:528/0
  |  
提交时间:2015/09/02
强化学习
最优控制
近似策略迭代
概率近似最优
连续状态系统
收敛性
在线学习
Kd树
Reinforcement Learning
Optimal Control
Approximate Policy Iteration
Probably Approximately Correct
Continuous-state System
Convergence
Online Learning
Kd-tree
连续状态-动作空间下强化学习方法的研究
学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2005
作者:
程玉虎
收藏
  |  
浏览/下载:540/0
  |  
提交时间:2015/09/02
强化学习
连续空间
函数逼近
Rbf 网络
模糊推理系统
Reinforcement Learning
Continuous Space
Function Approximation
Rbf Network
Fuzzy Inference System
Neural-network-based online optimal control for uncertain non-linear continuous-time systems with control constraints
期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2013, 卷号: 7, 期号: 17, 页码: 2037-2047
作者:
Yang, Xiong
;
Liu, Derong
;
Huang, Yuzhu
浏览
  |  
Adobe PDF(493Kb)
  |  
收藏
  |  
浏览/下载:365/93
  |  
提交时间:2015/08/12
Adaptive Control
Approximation Theory
Closed Loop Systems
Continuous Time Systems
Lyapunov Methods
Neurocontrollers
Nonlinear Control Systems
Optimal Control
Robust Control
Uncertain Systems
Neural Network-based Online Adaptive Optimal Control
Uncertain Nonlinear Continuous-time Systems
Control Constraints
Infinite-horizon Optimal Control Problem
Control Policy
Saturation Constraints
Identifier-critic Architecture
Hamilton-jacobi-bellman Equation Approximation
Uncertain System Dynamics
Critic Nn
Action-critic Dual Networks
Reinforcement Learning
Identifier Nn
Policy Iteration
Lyapunovaeuros Direct Method
Closed Loop System Stability
Dynamic dual adjustment of daily budgets and bids in sponsored search auctions
期刊论文
DECISION SUPPORT SYSTEMS, 2014, 卷号: 57, 期号: 0, 页码: 105-114
作者:
Zhang, Jie
;
Yang, Yanwu
;
Li, Xin
;
Qin, Rui
;
Zeng, Daniel
浏览
  |  
Adobe PDF(983Kb)
  |  
收藏
  |  
浏览/下载:356/100
  |  
提交时间:2015/08/12
Sponsored Search Auction
Budget Adjustment
Continuous Reinforcement Learning
Dynamic Adjustment