中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

图片搜索

粘贴图片网址

CASIA OpenIR > 复杂系统认知与决策实验室 > 智能系统与工程

	面向Ad-Hoc协作的局部观测重建方法
	陈皓1,2 ; 杨立昆 1,2; 尹奇跃1,2 ; 黄凯奇1,2,3
发表期刊	中国科学院大学学报
	2022-04
页码	1
摘要	近年来,多智能体强化学习得到了研究人员们的广泛关注。在多智能体强化学习的研究中,如何进行Ad-Hoc协作,也就是说如何适应种类和数量变化的队友,是一个关键问题。现有方法或者有很强的先验知识假设,或者使用硬编码的规则来进行合作,缺乏通用性,无法泛化到更一般的Ad-Hoc协作场景。为解决该问题,本文提出了一种面向Ad-Hoc协作的局部观测重建算法,利用注意力机制和采样网络对局部观测进行重建,使得算法认识到并充分利用不同局面中的高维状态表征,实现了在Ad-Hoc协作场景下的零样本泛化。本文在星际争霸微操环境和Ad-Hoc协作场景上与代表性算法的性能进行对比与分析,验证了算法的有效性。
关键词	多智能体深度强化学习信用分配 Ad-Hoc协作
DOI	10.7523/j.ucas.2022.028.
URL	查看原文
收录类别	中文核心期刊要目总览
语种	中文
资助项目	National Natural Science Foundation of China[61876181]
引用统计
文献类型	期刊论文
条目标识符	http://ir.ia.ac.cn/handle/173211/48766
专题	复杂系统认知与决策实验室_智能系统与工程
通讯作者	黄凯奇
作者单位	1.中国科学院自动化研究所智能系统与工程研究中心 2.中国科学院大学人工智能学院 3.中国科学院脑科学与智能技术卓越创新中心
第一作者单位	中国科学院自动化研究所
通讯作者单位	中国科学院自动化研究所
推荐引用方式 GB/T 7714	陈皓,杨立昆,尹奇跃,等. 面向Ad-Hoc协作的局部观测重建方法[J]. 中国科学院大学学报,2022:1.
APA	陈皓,杨立昆,尹奇跃,&黄凯奇.(2022).面向Ad-Hoc协作的局部观测重建方法.中国科学院大学学报,1.
MLA	陈皓,et al."面向Ad-Hoc协作的局部观测重建方法".中国科学院大学学报 (2022):1.

条目包含的文件		下载所有文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
陈皓和 CHEN Hao - 2022（1491KB）	期刊论文	作者接受稿	开放获取	CC BY-NC-SA	浏览下载

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[陈皓]的文章

[杨立昆]的文章

[尹奇跃]的文章

百度学术

百度学术中相似的文章

[陈皓]的文章

[杨立昆]的文章

[尹奇跃]的文章

必应学术

必应学术中相似的文章

[陈皓]的文章

[杨立昆]的文章

[尹奇跃]的文章

相关权益政策

收藏/分享

文件名：	陈皓和 CHEN Hao - 2022 - 面向Ad-Hoc协作的局部观测重建方法.pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量24648
全文量12480
访问量5237220
下载量826857