CASIA OpenIR

浏览/检索结果: 共12条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊
创刊日期: 2018,
主办者:  Liu BY(刘博寅)
Adobe PDF(5797Kb)  |  收藏  |  浏览/下载:23/5  |  提交时间:2024/07/12
Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文
, 日本, 2024-6
作者:  Zhang Qingyang;  Xu Bo
Adobe PDF(8862Kb)  |  收藏  |  浏览/下载:21/7  |  提交时间:2024/06/25
强化学习,分层强化学习  
Learning Robust Communication by Adversarial Training in Networked System Control 期刊论文
Lecture Notes in Electrical Engineering, 2024, 页码: Chapter 52 978-981-97-3335-4
作者:  Runji, Lin;  Haifeng, Zhang
Adobe PDF(8334Kb)  |  收藏  |  浏览/下载:46/17  |  提交时间:2024/06/11
Networked System Control  Robustness  Communicative Multi-Agent Reinforcement Learning  
HAVEN: Hierarchical Cooperative Multi-Agent Reinforcement Learning with Dual Coordination Mechanism 会议论文
, Washington, DC, USA, February 7-14, 2023
作者:  Zhiwei Xu;  Yunpeng Bai;  Bin Zhang;  Dapeng Li;  Guoliang Fan
Adobe PDF(3345Kb)  |  收藏  |  浏览/下载:39/10  |  提交时间:2024/05/28
SOTVerse: A User-Defined Task Space of Single Object Tracking 期刊论文
International Journal of Computer Vision, 2023, 卷号: 132, 期号: 3, 页码: 1-59
作者:  Shiyu, Hu;  Xin, Zhao;  Kaiqi Huang
Adobe PDF(53048Kb)  |  收藏  |  浏览/下载:88/8  |  提交时间:2024/01/22
Single object tracking  Experimental environment  Evaluation system  Performance analysis  
Intrinsic Reward with Peer Incentives for Cooperative Multi-Agent Reinforcement Learning 会议论文
, Online, 18-23 July 2022
作者:  Zhang TL(张天乐);  Liu Z(刘振);  Wu SG(吴士广);  Pu ZQ(蒲志强);  Yi JQ(易建强)
Adobe PDF(2189Kb)  |  收藏  |  浏览/下载:232/68  |  提交时间:2023/06/12
Peer Incentive Reinforcement Learning for Cooperative Multi-Agent Games 期刊论文
IEEE Transactions on Games, 2022, 页码: 1-14
作者:  Zhang TL(张天乐);  Liu Z(刘振);  Pu ZQ(蒲志强);  Yi JQ(易建强)
Adobe PDF(18835Kb)  |  收藏  |  浏览/下载:134/33  |  提交时间:2023/06/12
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:353/87  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能  
盲人视觉辅助导航技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  周至公
Adobe PDF(13620Kb)  |  收藏  |  浏览/下载:271/3  |  提交时间:2021/06/24
盲人辅助  视觉导航  语义分割  知识蒸馏  
基于深度强化学习的群体协同决策关键问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  王彗木
Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:325/1  |  提交时间:2021/06/24
群体系统  协同决策  多智能体系统  深度强化学习  图卷积网络  注 意力机制