×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
复杂系统认知与决策... [10]
作者
易建强 [5]
蒲志强 [5]
刘振 [3]
丘腾海 [2]
吴士广 [2]
张天乐 [2]
更多...
文献类型
会议论文 [4]
期刊论文 [4]
学位论文 [2]
发表日期
2021 [10]
语种
英语 [8]
中文 [2]
出处
Algorithms [1]
IEEE Trans... [1]
IEEE Trans... [1]
NEURAL PRO... [1]
资助项目
National N... [1]
National N... [1]
收录类别
EI [5]
SCI [3]
导师
兴军亮 [1]
谭民 [1]
资助机构
National N... [1]
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共10条,第1-10条
帮助
限定条件
发表日期:2021
专题:复杂系统认知与决策实验室
第一作者的第一单位
第一作者单位
通讯作者单位
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
期刊影响因子升序
期刊影响因子降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
作者升序
作者降序
WOS被引频次升序
WOS被引频次降序
题名升序
题名降序
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning
会议论文
, Shenzhen, China, 18-22 July 2021
作者:
Zhiwei Xu
;
Dapeng Li
;
Yunpeng Bai
;
Guoliang Fan
Adobe PDF(3892Kb)
  |  
收藏
  |  
浏览/下载:7/2
  |  
提交时间:2024/05/28
Hierarchical Cooperative Swarm Policy Learning with Role Emergence
会议论文
, Online, 05-07 December 2021
作者:
Zhang TL(张天乐)
;
Liu Z(刘振)
;
Pu ZQ(蒲志强)
;
Qiu TH(丘腾海)
;
Yi JQ(易建强)
Adobe PDF(327Kb)
  |  
收藏
  |  
浏览/下载:131/57
  |  
提交时间:2023/06/12
Semantic Perception Swarm Policy with Deep Reinforcement Learning
会议论文
, Online, 05 December 2021
作者:
Zhang TL(张天乐)
;
Liu Z(刘振)
;
Pu ZQ(蒲志强)
;
Yi JQ(易建强)
Adobe PDF(523Kb)
  |  
收藏
  |  
浏览/下载:106/43
  |  
提交时间:2023/06/12
Multi-agent Collaborative Learning with Relational Graph Reasoning in Adversarial Environments
会议论文
, 线上会议, 2021-9
作者:
Wu Shiguang
;
Qiu Tenghai
;
Pu Zhiqiang
;
Yi Jianqiang
Adobe PDF(1396Kb)
  |  
收藏
  |  
浏览/下载:238/69
  |  
提交时间:2022/06/16
Formation control with collision avoidance through deep reinforcement learning using model-guided demonstration
期刊论文
IEEE Transactions on Neural Networks and Learning Systems, 2021, 卷号: 32, 期号: 6, 页码: 2358-2372
作者:
Zezhi Sui
;
Zhiqiang Pu
;
Jianqiang Yi
;
Shiguang Wu
Adobe PDF(5344Kb)
  |  
收藏
  |  
浏览/下载:234/76
  |  
提交时间:2022/04/02
Collision avoidance
deep reinforcement learning (DRL)
formation control
leader–follower
仿生滑翔机器鲸鲨的运动控制与自主对接充电研究
学位论文
, 北京: 中国科学院大学, 2021
作者:
董会杰
Adobe PDF(7686Kb)
  |  
收藏
  |  
浏览/下载:289/15
  |  
提交时间:2021/12/31
仿生滑翔机器鲸鲨
滑翔效率优化
滑翔运动控制
自主对接充电
Multi-Agent Hierarchical Cognition Difference Policy for Multi-Agent Cooperation
期刊论文
Algorithms, 2021, 期号: 14, 页码: 98
作者:
Huimu Wang
;
Zhen Liu
;
Jianqiang Yi
;
Zhiqiang Pu
Adobe PDF(1155Kb)
  |  
收藏
  |  
浏览/下载:242/49
  |  
提交时间:2021/06/24
multiagent system
deep reinforcement learning
variational autoencoder
attention mechanism
基于演化学习与对手策略的不完美信息博弈算法研究
学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:
张蒙
Adobe PDF(2515Kb)
  |  
收藏
  |  
浏览/下载:366/9
  |  
提交时间:2021/06/20
不完美信息博弈
德州扑克
演化学习
在线对手建模
种群策略集成
Real-time path planning and following of a gliding robotic dolphin within a hierarchical framework
期刊论文
IEEE Transactions on Vehicular Technology, 2021, 卷号: 70, 期号: 4, 页码: 3243-3255
作者:
Wang, Jian(王健)
;
Wu, Zhengxing
;
Yan, Shuaizheng
;
Tan, Min
;
Yu, Junzhi
Adobe PDF(3837Kb)
  |  
收藏
  |  
浏览/下载:237/51
  |  
提交时间:2021/06/04
Adaptive backstepping
hierarchical deep q-network
path following
path planning
underwater robot
Object Reconstruction Based on Attentive Recurrent Network from Single and Multiple Images
期刊论文
NEURAL PROCESSING LETTERS, 2021, 期号: 53, 页码: 18
作者:
Gao, Zishu
;
Li, En
;
Wang, Zhe
;
Yang, Guodong
;
Lu, Jiwu
;
Ouyang, Bo
;
Xu, Dawei
;
Liang, Zize
Adobe PDF(1338Kb)
  |  
收藏
  |  
浏览/下载:273/56
  |  
提交时间:2021/03/01
Object reconstruction
Convolutional LSTM
Visual attention
Robotic application