验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策... [39]

多模态人工智能系统全... [1]

紫东太初大模型研究中... [1]

作者

文献类型

期刊论文 [19]

会议论文 [10]

学位论文 [10]

发表日期

语种

出处

BIOMIMETIC... [2]

自动化学报 [2]

FRONTIERS ... [1]

FRONTIERS ... [1]

IEEE Senso... [1]

IEEE TRANS... [1]

资助项目

National N... [3]

National N... [2]

National N... [2]

Strategic ... [2]

Beijing Na... [1]

Beijing Na... [1]

收录类别

EI [8]

导师

资助机构

National N... [8]

Beijing Na... [2]

National K... [2]

Strategic ... [2]

National K... [1]

National K... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共39条，第1-10条

帮助

限定条件	专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang; Xu Bo Adobe PDF(8862Kb) \| 收藏 \| 浏览/下载：35/10 \| 提交时间：2024/06/25 强化学习，分层强化学习
	Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang; Yang Yiming; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng; Xu Bo Adobe PDF(7948Kb) \| 收藏 \| 浏览/下载：45/17 \| 提交时间：2024/06/25 强化学习，分层强化学习
	Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang; Zhang Hongming; Xing Dengpeng; Bo Xu Adobe PDF(9639Kb) \| 收藏 \| 浏览/下载：29/13 \| 提交时间：2024/06/25
	Multi-Scale Dynamic Coding Improved Spiking Actor Network for Reinforcement Learning 会议论文 , Online, February 22–March 1, 2022 作者: Zhang, Duzhen; Zhang, Tielin; Jia, Shuncheng; Xu, Bo Adobe PDF(2249Kb) \| 收藏 \| 浏览/下载：48/16 \| 提交时间：2024/06/11
	M3: Modularization for Multi-task and Multi-agent Offline Pre-training 会议论文 , London, United Kingdom, 2023.5.29-2023.6.2 作者: Meng Linghui; Ruan Jingqing; Xiong Xuantang; Li Xiyun; Zhang Xi; Xing Dengpeng; Xu Bo Adobe PDF(1302Kb) \| 收藏 \| 浏览/下载：42/12 \| 提交时间：2024/06/11
	Fuzzy Feedback Multi-Agent Reinforcement Learning for Adversarial Dynamic Multi-Team Competitions 期刊论文 IEEE Transactions on Fuzzy Systems, 2024, 页码: 1 作者: Qingxu Fu; Zhiqiang Pu; Yi Pan; Tenghai Qiu; Jianqiang Yi Adobe PDF(4975Kb) \| 收藏 \| 浏览/下载：56/17 \| 提交时间：2024/06/05
	Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning 会议论文 , New Orleans, LA, USA,, November 28 - December 9, 2022 作者: Zhiwei Xu; Dapeng Li; Bin Zhang; Yuan Zhan; Yunpeng Bai; Guoliang Fan Adobe PDF(4367Kb) \| 收藏 \| 浏览/下载：44/9 \| 提交时间：2024/05/28
	Target-Following Control of a Biomimetic Autonomous System Based on Predictive Reinforcement Learning 期刊论文 BIOMIMETICS, 2024, 卷号: 9, 期号: 1, 页码: 19 作者: Wang, Yu; Wang, Jian; Kang, Song; Yu, Junzhi Adobe PDF(1553Kb) \| 收藏 \| 浏览/下载：98/24 \| 提交时间：2024/03/26 biomimetic motion biomimetic autonomous system target following deep reinforcement learning predictive control
	Spatial Domain Image Fusion with Particle Swarm Optimization and Lightweight AlexNet for Robotic Fish Sensor Fault Diagnosis 期刊论文 BIOMIMETICS, 2023, 卷号: 8, 期号: 6, 页码: 489 作者: Fan, Xuqing; Deng, Sai; Wu, Zhengxing; Fan, Junfeng; Zhou, Chao Adobe PDF(5062Kb) \| 收藏 \| 浏览/下载：150/17 \| 提交时间：2023/12/21 image fusion lightweight AlexNet particle swarm optimization fault diagnosis robotic fish
	Large sequence models for sequential decision-making: a survey 期刊论文 FRONTIERS OF COMPUTER SCIENCE, 2023, 卷号: 17, 期号: 6, 页码: 18 作者: Wen, Muning; Lin, Runji; Wang, Hanjing; Yang, Yaodong; Wen, Ying; Mai, Luo; Wang, Jun; Zhang, Haifeng; Zhang, Weinan Adobe PDF(1351Kb) \| 收藏 \| 浏览/下载：164/9 \| 提交时间：2023/11/17 sequential decision-making sequence modeling the Transformer training system

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25867
全文量13705
访问量5896674
下载量929369

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495