已选(0)清除
条数/页: 排序方式: |
| Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊 创刊日期: 2018, 主办者: Liu BY(刘博寅)
Adobe PDF(5797Kb)  |   收藏  |  浏览/下载:23/5  |  提交时间:2024/07/12 |
| Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang ; Xu Bo![](/image/person.jpg)
Adobe PDF(8862Kb)  |   收藏  |  浏览/下载:21/7  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| Learning Robust Communication by Adversarial Training in Networked System Control 期刊论文 Lecture Notes in Electrical Engineering, 2024, 页码: Chapter 52 978-981-97-3335-4 作者: Runji, Lin ; Haifeng, Zhang
Adobe PDF(8334Kb)  |   收藏  |  浏览/下载:46/17  |  提交时间:2024/06/11 Networked System Control Robustness Communicative Multi-Agent Reinforcement Learning |
| HAVEN: Hierarchical Cooperative Multi-Agent Reinforcement Learning with Dual Coordination Mechanism 会议论文 , Washington, DC, USA, February 7-14, 2023 作者: Zhiwei Xu ; Yunpeng Bai ; Bin Zhang; Dapeng Li ; Guoliang Fan![](/image/person.jpg)
Adobe PDF(3345Kb)  |   收藏  |  浏览/下载:39/10  |  提交时间:2024/05/28 |
| SOTVerse: A User-Defined Task Space of Single Object Tracking 期刊论文 International Journal of Computer Vision, 2023, 卷号: 132, 期号: 3, 页码: 1-59 作者: Shiyu, Hu ; Xin, Zhao; Kaiqi Huang![](/image/person.jpg)
Adobe PDF(53048Kb)  |   收藏  |  浏览/下载:88/8  |  提交时间:2024/01/22 Single object tracking Experimental environment Evaluation system Performance analysis |
| Intrinsic Reward with Peer Incentives for Cooperative Multi-Agent Reinforcement Learning 会议论文 , Online, 18-23 July 2022 作者: Zhang TL(张天乐) ; Liu Z(刘振) ; Wu SG(吴士广) ; Pu ZQ(蒲志强) ; Yi JQ(易建强)![](/image/person.jpg)
Adobe PDF(2189Kb)  |   收藏  |  浏览/下载:232/68  |  提交时间:2023/06/12 |
| Peer Incentive Reinforcement Learning for Cooperative Multi-Agent Games 期刊论文 IEEE Transactions on Games, 2022, 页码: 1-14 作者: Zhang TL(张天乐) ; Liu Z(刘振) ; Pu ZQ(蒲志强) ; Yi JQ(易建强)![](/image/person.jpg)
Adobe PDF(18835Kb)  |   收藏  |  浏览/下载:134/33  |  提交时间:2023/06/12 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强 ; 易建强 ; 刘振 ; 丘腾海 ; 孙金林 ; 李非墨![](/image/person.jpg)
Adobe PDF(1352Kb)  |   收藏  |  浏览/下载:353/87  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |
| 盲人视觉辅助导航技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 周至公![](/image/person.jpg)
Adobe PDF(13620Kb)  |   收藏  |  浏览/下载:271/3  |  提交时间:2021/06/24 盲人辅助 视觉导航 语义分割 知识蒸馏 |
| 基于深度强化学习的群体协同决策关键问题研究 学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木![](/image/person.jpg)
Adobe PDF(8945Kb)  |   收藏  |  浏览/下载:325/1  |  提交时间:2021/06/24 群体系统 协同决策 多智能体系统 深度强化学习 图卷积网络 注 意力机制 |