Knowledge Commons of Institute of Automation,CAS
面向Ad-Hoc协作的局部观测重建方法 | |
陈皓1,2; 杨立昆1,2; 尹奇跃1,2; 黄凯奇1,2,3 | |
发表期刊 | 中国科学院大学学报 |
2022-04 | |
页码 | 1 |
摘要 | 近年来,多智能体强化学习得到了研究人员们的广泛关注。在多智能体强化学习的研究中,如何进行Ad-Hoc协作,也就是说如何适应种类和数量变化的队友,是一个关键问题。现有方法或者有很强的先验知识假设,或者使用硬编码的规则来进行合作,缺乏通用性,无法泛化到更一般的Ad-Hoc协作场景。为解决该问题,本文提出了一种面向Ad-Hoc协作的局部观测重建算法,利用注意力机制和采样网络对局部观测进行重建,使得算法认识到并充分利用不同局面中的高维状态表征,实现了在Ad-Hoc协作场景下的零样本泛化。本文在星际争霸微操环境和Ad-Hoc协作场景上与代表性算法的性能进行对比与分析,验证了算法的有效性。 |
关键词 | 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
DOI | 10.7523/j.ucas.2022.028. |
URL | 查看原文 |
收录类别 | 中文核心期刊要目总览 |
语种 | 中文 |
资助项目 | National Natural Science Foundation of China[61876181] |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/48766 |
专题 | 复杂系统认知与决策实验室_智能系统与工程 |
通讯作者 | 黄凯奇 |
作者单位 | 1.中国科学院自动化研究所智能系统与工程研究中心 2.中国科学院大学人工智能学院 3.中国科学院脑科学与智能技术卓越创新中心 |
第一作者单位 | 中国科学院自动化研究所 |
通讯作者单位 | 中国科学院自动化研究所 |
推荐引用方式 GB/T 7714 | 陈皓,杨立昆,尹奇跃,等. 面向Ad-Hoc协作的局部观测重建方法[J]. 中国科学院大学学报,2022:1. |
APA | 陈皓,杨立昆,尹奇跃,&黄凯奇.(2022).面向Ad-Hoc协作的局部观测重建方法.中国科学院大学学报,1. |
MLA | 陈皓,et al."面向Ad-Hoc协作的局部观测重建方法".中国科学院大学学报 (2022):1. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
陈皓 和 CHEN Hao - 2022(1491KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[陈皓]的文章 |
[杨立昆]的文章 |
[尹奇跃]的文章 |
百度学术 |
百度学术中相似的文章 |
[陈皓]的文章 |
[杨立昆]的文章 |
[尹奇跃]的文章 |
必应学术 |
必应学术中相似的文章 |
[陈皓]的文章 |
[杨立昆]的文章 |
[尹奇跃]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论