已选(0)清除
条数/页: 排序方式: |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:12/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:15/2  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| Dual Self-Awareness Value Decomposition Framework without Individual Global Max for Cooperative MARL 会议论文 , New Orleans, LA, USA, December 10-16, 2023 作者: Zhiwei Xu; Bin Zhang; Dapeng Li; Guangchong Zhou; Zeren Zhang; Guoliang Fan Adobe PDF(8700Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/28 |
| Consensus Learning for Cooperative Multi-Agent Reinforcement Learning 会议论文 , Washington, DC, USA, February 7-14, 2023 作者: Zhiwei Xu; Bin Zhang; Dapeng Li; Zeren Zhang; Guangchong Zhou; Hao Chen; Guoliang Fan Adobe PDF(4141Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/28 |
| HAVEN: Hierarchical Cooperative Multi-Agent Reinforcement Learning with Dual Coordination Mechanism 会议论文 , Washington, DC, USA, February 7-14, 2023 作者: Zhiwei Xu; Yunpeng Bai; Bin Zhang; Dapeng Li; Guoliang Fan Adobe PDF(3345Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 |
| Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning 会议论文 , New Orleans, LA, USA,, November 28 - December 9, 2022 作者: Zhiwei Xu; Dapeng Li; Bin Zhang; Yuan Zhan; Yunpeng Bai; Guoliang Fan Adobe PDF(4367Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/28 |
| SIDE: State Inference for Partially Observable Cooperative Multi-Agent Reinforcement Learning 会议论文 , Auckland, New Zealand, May 9-13, 2022 作者: Zhiwei Xu; Yunpeng Bai; Dapeng Li; Bin Zhang; Guoliang Fan Adobe PDF(2965Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 |
| Learning to Coordinate via Multiple Graph Neural Networks 会议论文 , BALI, Indonesia, December 8-12, 2021 作者: Zhiwei Xu; Bin Zhang; Yunpeng Bai; Dapeng Li; Guoliang Fan Adobe PDF(2047Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/05/28 |
| MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning 会议论文 , Shenzhen, China, 18-22 July 2021 作者: Zhiwei Xu; Dapeng Li; Yunpeng Bai; Guoliang Fan Adobe PDF(3892Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/28 |