×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
毕业生 [5]
作者
刘裕良 [1]
朱圆恒 [1]
詹员 [1]
龚晨 [1]
文献类型
学位论文 [5]
发表日期
2023 [2]
2016 [1]
2015 [2]
语种
中文 [4]
出处
资助项目
收录类别
导师
刘德荣 [1]
王飞跃 [1]
赵冬斌 [1]
资助机构
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共5条,第1-5条
帮助
限定条件
专题:毕业生
第一作者的第一单位
第一作者单位
通讯作者单位
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
题名升序
题名降序
发表日期升序
发表日期降序
期刊影响因子升序
期刊影响因子降序
作者升序
作者降序
基于表示学习和对手建模的动态博弈系统策略生成技术研究
学位论文
, 2023
作者:
詹员
Adobe PDF(12738Kb)
  |  
收藏
  |  
浏览/下载:125/8
  |  
提交时间:2023/06/06
深度强化学习
表示学习
对手建模
空中博弈
执行者-评论家算法框架下的强化学习稳定性研究
学位论文
, 2023
作者:
龚晨
Adobe PDF(8324Kb)
  |  
收藏
  |  
浏览/下载:96/6
  |  
提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击
基于计算实验的区域路网交通信号控制研究
学位论文
, 北京: 中国科学院大学, 2016
作者:
刘裕良
Adobe PDF(5332Kb)
  |  
收藏
  |  
浏览/下载:215/2
  |  
提交时间:2016/06/27
计算实验
交通信号控制
区域路网
集成自适应动态规划
连续状态系统的近似最优在线强化学习
学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:
朱圆恒
Adobe PDF(2679Kb)
  |  
收藏
  |  
浏览/下载:499/0
  |  
提交时间:2015/09/02
强化学习
最优控制
近似策略迭代
概率近似最优
连续状态系统
收敛性
在线学习
Kd树
Reinforcement Learning
Optimal Control
Approximate Policy Iteration
Probably Approximately Correct
Continuous-state System
Convergence
Online Learning
Kd-tree
基于数据的自适应动态规划最优控制与微分博弈研究
学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:
李宏亮
Adobe PDF(2578Kb)
  |  
收藏
  |  
浏览/下载:1103/0
  |  
提交时间:2015/09/02
智能控制
自适应动态规划
神经网络
最优控制
微分博弈
Intelligent Control
Adaptive Dynamic Programming
Neural Networks
Optimal Controldifferential Games
Differential Games