×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系统全... [7]
复杂系统认知与决策实... [4]
离退休人员 [2]
紫东太初大模型研究中... [1]
综合信息系统研究中心 [1]
智能感知与计算研究中... [1]
更多...
作者
赵冬斌 [4]
李栋 [2]
黄凯奇 [2]
张俊格 [2]
张启超 [2]
朱圆恒 [2]
更多...
文献类型
期刊论文 [7]
会议论文 [6]
学位论文 [5]
发表日期
2019 [18]
语种
英语 [10]
中文 [5]
出处
IEEE TRANS... [2]
IEEE Compu... [1]
IEEE TRANS... [1]
IEEE TRANS... [1]
IEEE Trans... [1]
Journal of... [1]
更多...
资助项目
National N... [2]
Shandong P... [2]
Binzhou Un... [1]
Doctoral S... [1]
Macau Scie... [1]
Macau Scie... [1]
更多...
收录类别
SCI [6]
EI [5]
导师
赵冬斌 [2]
唐明 [1]
曾毅 [1]
王飞跃 [1]
资助机构
National N... [2]
Shandong P... [2]
Binzhou Un... [1]
Doctoral S... [1]
Macau Scie... [1]
University... [1]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共18条,第1-10条
帮助
限定条件
发表日期:2019
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
题名升序
题名降序
发表日期升序
发表日期降序
期刊影响因子升序
期刊影响因子降序
作者升序
作者降序
Learning to Navigate in Human Environments via Deep Reinforcement Learning
会议论文
, Sydney, Australia, 2019-12-12至2019-12-15
作者:
Xingyuan Gao
;
Shiying Sun
;
Xiaoguang Zhao
;
Min Tan
Adobe PDF(1298Kb)
  |  
收藏
  |  
浏览/下载:149/44
  |  
提交时间:2022/03/31
Conservative Policy Gradient in Multi-critic Setting
会议论文
, Hangzhou, China, 2019.11.22-24
作者:
Xi, Bao
;
Wang, Rui
;
Wang, Shuo
;
Lu, Tao
;
Cai, Yinghao
Adobe PDF(379Kb)
  |  
收藏
  |  
浏览/下载:185/63
  |  
提交时间:2021/02/02
inconsistancy
stablility
Q learning
policy gradient
Fast A3RL: Aesthetics-Aware Adversarial Reinforcement Learning for Image Cropping
期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2019, 卷号: 28, 期号: 10, 页码: 5105-5120
作者:
Li, Debang
;
Wu, Huikai
;
Zhang, Junge
;
Huang, Kaiqi
Adobe PDF(6588Kb)
  |  
收藏
  |  
浏览/下载:367/41
  |  
提交时间:2019/12/16
Reinforcement learning
adversarial learning
image cropping
Adaptive Tracking Control of Surface Vessel Using Optimized Backstepping Technique
期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2019, 卷号: 49, 期号: 9, 页码: 3420-3431
作者:
Wen, Guoxing
;
Ge, Shuzhi Sam
;
Chen, C. L. Philip
;
Tu, Fangwen
;
Wang, Shengnan
收藏
  |  
浏览/下载:171/0
  |  
提交时间:2019/12/16
Actor-critic architecture
Lyapunov stability
optimized backstepping (OB)
reinforcement learning (RL)
surface vessel
Optimized Adaptive Nonlinear Tracking Control Using Actor-Critic Reinforcement Learning Strategy
期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2019, 卷号: 15, 期号: 9, 页码: 4969-4977
作者:
Wen, Guoxing
;
Chen, C. L. Philip
;
Ge, Shuzhi Sam
;
Yang, Hongli
;
Liu, Xiaoguang
收藏
  |  
浏览/下载:208/0
  |  
提交时间:2019/12/16
Lyapunov function
neural networks (NNs)
nonlinear systems
optimized tracking control
reinforcement learning (RL) of actor-critic architecture
Data-Based Reinforcement Learning for Nonzero-Sum Games With Unknown Drift Dynamics
期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2019, 卷号: 49, 期号: 8, 页码: 2874-2885
作者:
Zhang, Qichao
;
Zhao, Dongbin
浏览
  |  
Adobe PDF(1021Kb)
  |  
收藏
  |  
浏览/下载:407/120
  |  
提交时间:2019/07/12
Integral reinforcement learning (IRL)
neural network (NN)
nonzero-sum (NZS) games
off-policy
single-critic
unknown drift dynamics
Autonomous Navigation with Improved Hierarchical Neural Network Based on Deep Reinforcement Learning
会议论文
, 中国 广州, 2019.07.27-2019.07.30
作者:
Zhang, Haiying
;
Qiu, Tenghai
;
Li, Shuxiao
;
Zhu, Chengfei
;
Lan, Xiaosong
;
Chang, Hongxing
浏览
  |  
Adobe PDF(349Kb)
  |  
收藏
  |  
浏览/下载:274/90
  |  
提交时间:2020/06/09
Autonomous Navigation
DDPG
Improved Hierarchical Neural Network
Curriculum Learning
类脑自主学习与决策神经网络模型
学位论文
, 中国科学院大学: 中国科学院自动化化研究所, 2019
作者:
赵菲菲
Adobe PDF(16032Kb)
  |  
收藏
  |  
浏览/下载:770/18
  |  
提交时间:2019/06/05
类脑自主学习与决策
多脑区协同
脉冲神经网络
发育神经网络
微观可塑性
视觉恐惧反应模型
无人机自主决策
平行学习理论及其在智能交通系统中的应用
学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:
林懿伦
Adobe PDF(17378Kb)
  |  
收藏
  |  
浏览/下载:424/4
  |  
提交时间:2019/07/15
平行学习
强化学习
深度学习
智能交通系统
基于深度学习的视觉目标跟踪方法研究
学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
作者:
赵飞
Adobe PDF(37107Kb)
  |  
收藏
  |  
浏览/下载:319/13
  |  
提交时间:2019/06/04
视觉目标跟踪
深度学习
强化学习
对抗学习