已选(0)清除
条数/页: 排序方式: |
| A Cooperation Graph Approach for Multiagent Sparse Reward Reinforcement Learning 会议论文 , Padua, Italy, 2022年07月 作者: Qingxu Fu; Tenghai Qiu; Zhiqiang Pu; Jianqiang Yi; Wanmai Yuan Adobe PDF(2650Kb)  |  收藏  |  浏览/下载:13/3  |  提交时间:2024/06/05 |
| Intrinsic Reward with Peer Incentives for Cooperative Multi-Agent Reinforcement Learning 会议论文 , Online, 18-23 July 2022 作者: Zhang TL(张天乐); Liu Z(刘振); Wu SG(吴士广); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(2189Kb)  |  收藏  |  浏览/下载:201/56  |  提交时间:2023/06/12 |
| Multi-UAV Cooperative Short-Range Combat via Attention-Based Reinforcement Learning using Individual Reward Shaping 会议论文 , Kyoto, Japan, October 23-27, 2022 作者: Zhang TL(张天乐); Qiu TH(丘腾海); Liu Z(刘振); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(896Kb)  |  收藏  |  浏览/下载:148/48  |  提交时间:2023/06/12 |
| Multi-Target Encirclement with Collision Avoidance via Deep Reinforcement Learning using Relational Graphs 会议论文 , Philadelphia, PA, USA, May 23-27, 2022 作者: Zhang TL(张天乐); Liu Z(刘振); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(4277Kb)  |  收藏  |  浏览/下载:150/35  |  提交时间:2023/06/12 |
| LEARN EFFECTIVE REPRESENTATION FOR DEEP REINFORCEMENT LEARNING 会议论文 , Taipei, Taiwan, 26 August 2022 作者: Zhan Yuan; Xu Zhiwei; Fan Guoliang Adobe PDF(2093Kb)  |  收藏  |  浏览/下载:156/50  |  提交时间:2023/06/08 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:499/85  |  提交时间:2022/07/12 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:202/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:237/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强; 易建强; 刘振; 丘腾海; 孙金林; 李非墨 Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:312/78  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |