×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系统... [26]
作者
赵冬斌 [26]
张启超 [10]
朱圆恒 [7]
吕乐 [3]
邵坤 [3]
王鼎 [2]
更多...
文献类型
期刊论文 [14]
会议论文 [12]
发表日期
2017 [26]
语种
英语 [11]
中文 [1]
出处
IEEE TRANS... [2]
IEEE TRANS... [2]
COGNITIVE ... [1]
ENERGIES [1]
IEEE COMPU... [1]
IEEE TRANS... [1]
更多...
资助项目
收录类别
SCI [11]
EI [2]
SSCI [2]
导师
资助机构
61573353 [6]
National N... [5]
61533017 [4]
61533017) [4]
National K... [3]
61603382) [2]
更多...
×
知识图谱
CASIA OpenIR
>
多模态人工智能系统全国重点实验室
>
深度强化学习
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共26条,第1-10条
帮助
限定条件
专题:深度强化学习
第一作者的第一单位
第一作者单位
通讯作者单位
发表日期:2017
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
发表日期升序
发表日期降序
作者升序
作者降序
WOS被引频次升序
WOS被引频次降序
题名升序
题名降序
期刊影响因子升序
期刊影响因子降序
深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero
期刊论文
控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546
作者:
唐振韬
;
邵 坤
;
赵冬斌
;
朱圆恒
Adobe PDF(8232Kb)
  |  
收藏
  |  
浏览/下载:214/33
  |  
提交时间:2021/07/05
深度强化学习
AlphaGo Zero
深度学习
强化学习
人工智能
Event-triggered integral reinforcement learning for nonlinear continuous-time systems
会议论文
, Honolulu, Hawaii, USA, Nov. 27 to Dec 1, 2017
作者:
Qichao Zhang
;
Dongbin Zhao
收藏
  |  
浏览/下载:59/0
  |  
提交时间:2019/10/09
Comparison of methods to efficient graph SLAM under general optimization framework
会议论文
YAC 2017
作者:
Haoran Li
;
Qichao Zhang
;
Dongbin Zhao
浏览
  |  
Adobe PDF(151Kb)
  |  
收藏
  |  
浏览/下载:881/509
  |  
提交时间:2017/12/31
Optimization
Slam
Pose Graph
Multi-task learning with Cartesianproduct-based multi-objective combination fordangerous object detection
会议论文
Part of the Lecture Notes in Computer Science book series (LNCS, volume 10261)
作者:
Yaran Chen
;
Dongbin Zhao
浏览
  |  
Adobe PDF(751Kb)
  |  
收藏
  |  
浏览/下载:302/88
  |  
提交时间:2017/12/31
Dangerous Object Detection
Multi-task Learning
Convolutional Neural Network
FMR-GA -- A cooperative multi-agent reinformcement learning algorithm based on gradient ascent
期刊论文
Part of the Lecture Notes in Computer Science book series (LNCS, volume 10634), 2017, 期号: *, 页码: 840–848
作者:
Zhen Zhang
;
Dongqing Wang
;
Dongbin Zhao
;
Tingting Song
收藏
  |  
浏览/下载:136/0
  |  
提交时间:2017/12/31
Reinforcement Learning
Multi-agent
Gradient Ascent
Q-learning
Building Energy Consumption Prediction: An Extreme Deep Learning Approach
期刊论文
ENERGIES, 2017, 卷号: 10, 期号: 10, 页码: 1-20
作者:
Li, Chengdong
;
Ding, Zixiang
;
Zhao, Dongbin
;
Yi, Jianqiang
;
Zhang, Guiqing
浏览
  |  
Adobe PDF(1918Kb)
  |  
收藏
  |  
浏览/下载:300/46
  |  
提交时间:2017/12/30
Building Energy Consumption
Deep Learning
Stacked Autoencoders
Extreme Learning Machine
Policy Gradient Methods with Gaussian Process Modelling Acceleration
会议论文
, Anchorage, AK, USA, 14-19 May 2017
作者:
Li, Dong
;
Zhao, Dongbin
;
Zhang, Qichao
;
Luo, Chaomin
浏览
  |  
Adobe PDF(720Kb)
  |  
收藏
  |  
浏览/下载:297/93
  |  
提交时间:2017/12/28
Event-Triggered Adaptive Dynamic Programming for Uncertain Nonlinear Systems
会议论文
, Beijing, China, November 19–23
作者:
Zhang,Qichao
;
Zhao,Dongbin
;
Wang,Ding
浏览
  |  
Adobe PDF(153Kb)
  |  
收藏
  |  
浏览/下载:187/75
  |  
提交时间:2017/12/28
Off-Policy Reinforcement Learning for Partially Unknown Nonzero-Sum Games
会议论文
, Guangzhou China, November 14–18
作者:
Zhang,Qichao
;
Zhao,Dongbin
;
Zhang,Sibo
浏览
  |  
Adobe PDF(119Kb)
  |  
收藏
  |  
浏览/下载:236/84
  |  
提交时间:2017/12/28
Cooperative Reinforcement Learning for Multiple Units Combat in StarCraft
会议论文
, Honolulu, Hawaii, USA, Nov. 27 to Dec 1, 2017
作者:
Shao K(邵坤)
;
Zhu YH(朱圆恒)
;
Zhao DB(赵冬斌)
浏览
  |  
Adobe PDF(1378Kb)
  |  
收藏
  |  
浏览/下载:525/261
  |  
提交时间:2017/09/20