×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
复杂系统认知与决策... [26]
作者
喻俊志 [9]
谭民 [6]
吴正兴 [6]
易建强 [6]
蒲志强 [6]
张天乐 [5]
更多...
文献类型
期刊论文 [21]
会议论文 [4]
学位论文 [1]
发表日期
2023 [26]
语种
英语 [17]
中文 [2]
出处
Biomimetic... [2]
IEEE TRANS... [2]
Bioinspira... [1]
FRONTIERS ... [1]
IEEE Robot... [1]
IEEE TRANS... [1]
更多...
资助项目
National N... [2]
National N... [2]
National N... [2]
External C... [1]
External C... [1]
Joint Fund... [1]
更多...
收录类别
SCI [16]
EI [5]
中文核心期刊要目总览 [1]
其他 [1]
导师
资助机构
National N... [5]
External C... [1]
Joint Fund... [1]
Ministry o... [1]
National K... [1]
New Genera... [1]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共26条,第1-10条
帮助
限定条件
发表日期:2023
专题:复杂系统认知与决策实验室
第一作者的第一单位
第一作者单位
通讯作者单位
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
期刊影响因子升序
期刊影响因子降序
作者升序
作者降序
题名升序
题名降序
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning
期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:
Zhang Qingyang
;
Zhang Hongming
;
Xing Dengpeng
;
Bo Xu
Adobe PDF(9639Kb)
  |  
收藏
  |  
浏览/下载:8/5
  |  
提交时间:2024/06/25
M3: Modularization for Multi-task and Multi-agent Offline Pre-training
会议论文
, London, United Kingdom, 2023.5.29-2023.6.2
作者:
Meng Linghui
;
Ruan Jingqing
;
Xiong Xuantang
;
Li Xiyun
;
Zhang Xi
;
Xing Dengpeng
;
Xu Bo
Adobe PDF(1302Kb)
  |  
收藏
  |  
浏览/下载:20/5
  |  
提交时间:2024/06/11
Learning Heterogeneous Agent Cooperation via Multiagent League Training
期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:
Qingxu, Fu
;
Xiaolin Ai
;
Jianqiang Yi
;
Tenghai Qiu
;
Wanmai Yuan
;
Zhiqiang Pu
Adobe PDF(996Kb)
  |  
收藏
  |  
浏览/下载:26/7
  |  
提交时间:2024/06/05
Improve the efficiency of deep reinforcement learning through semantic exploration guided by natural language.
会议论文
, 北京华腾美居酒店, 2023-12-9
作者:
Zhourui Guo
;
Meng Yao
;
Yang Yu
;
Qiyue Yin
Adobe PDF(2302Kb)
  |  
收藏
  |  
浏览/下载:16/6
  |  
提交时间:2024/06/03
Locomotion Optimization of a Tendon-Driven Robotic Fish with Variable Passive Tail Fin
期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, 2023, 页码: 4983 - 4992
作者:
Qiu CL(邱常林)
;
Wu ZX(吴正兴)
;
Wang J(王健)
;
Tan M(谭民)
;
Yu JZ(喻俊志)
Adobe PDF(1023Kb)
  |  
收藏
  |  
浏览/下载:41/17
  |  
提交时间:2024/05/29
Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning
会议论文
, Queensland, Australia, 2023-6
作者:
Yang, Chen
;
Yang, Guangkai
;
Chen, Hao
;
Zhang, Junge
Adobe PDF(3027Kb)
  |  
收藏
  |  
浏览/下载:42/17
  |  
提交时间:2024/05/29
SOTVerse: A User-Defined Task Space of Single Object Tracking
期刊论文
International Journal of Computer Vision, 2023, 卷号: 132, 期号: 3, 页码: 1-59
作者:
Shiyu, Hu
;
Xin, Zhao
;
Kaiqi Huang
Adobe PDF(53048Kb)
  |  
收藏
  |  
浏览/下载:73/6
  |  
提交时间:2024/01/22
Single object tracking
Experimental environment
Evaluation system
Performance analysis
单目标跟踪中的视觉智能评估技术综述
期刊论文
中国图象图形学报, 2023, 页码: 1-30
作者:
胡世宇
;
赵鑫
;
黄凯奇
Adobe PDF(10669Kb)
  |  
收藏
  |  
浏览/下载:145/39
  |  
提交时间:2024/01/22
智能评估技术
竞赛和数据集
视觉跟踪能力
单目标跟踪
目标跟踪算法
Multiagent-Reinforcement-Learning-Based Stable Path Tracking Control for a Bionic Robotic Fish With Reaction Wheel
期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, 2023, 卷号: 70, 期号: 12, 页码: 12670-12679
作者:
Qiu, Changlin
;
Wu, Zhengxing
;
Wang, Jian
;
Tan, Min
;
Yu, Junzhi
Adobe PDF(1587Kb)
  |  
收藏
  |  
浏览/下载:159/10
  |  
提交时间:2023/11/17
Multiagent reinforcement learning (MARL)
path tracking control
reaction wheel
robotic fish
underwater robot
Large sequence models for sequential decision-making: a survey
期刊论文
FRONTIERS OF COMPUTER SCIENCE, 2023, 卷号: 17, 期号: 6, 页码: 18
作者:
Wen, Muning
;
Lin, Runji
;
Wang, Hanjing
;
Yang, Yaodong
;
Wen, Ying
;
Mai, Luo
;
Wang, Jun
;
Zhang, Haifeng
;
Zhang, Weinan
Adobe PDF(1351Kb)
  |  
收藏
  |  
浏览/下载:138/1
  |  
提交时间:2023/11/17
sequential decision-making
sequence modeling
the Transformer
training system