已选(0)清除
条数/页: 排序方式: |
| 平行交通系统中的预测与控制关键技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 戴星原 Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:278/12  |  提交时间:2022/10/09 平行交通系统 交通预测 交通控制 深度学习 强化学习 |
| Cooperative Multi-Agent Reinforcement Learning with Hypergraph Convolution 会议论文 , Padua, Italy, 18-23 July 2022 作者: Yunpeng Bai; Chen Gong; Bin Zhang; Guoliang Fan; Xinwen Hou; Yu Liu Adobe PDF(8946Kb)  |  收藏  |  浏览/下载:95/30  |  提交时间:2023/06/14 |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:292/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 基于关系网络的多智能体协同分层决策技术 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张朋朋 Adobe PDF(9752Kb)  |  收藏  |  浏览/下载:207/12  |  提交时间:2022/06/13 多智能体协同 关系网络 分层 热力图 可解释性 |
| 基于多智能体强化学习的大规模路网交通信号控制 学位论文 学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈筱语 Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:181/12  |  提交时间:2022/06/16 交通信号控制 马尔科夫决策过程 多智能体强化学习 联邦强化学习 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:217/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:212/37  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
| Attention Enhanced Reinforcement Learning for Multi agent Cooperation 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 页码: 15 作者: Pu, Zhiqiang; Wang, Huimu; Liu, Zhen; Yi, Jianqiang; Wu, Shiguang Adobe PDF(2967Kb)  |  收藏  |  浏览/下载:292/41  |  提交时间:2022/06/06 Training Reinforcement learning Games Scalability Task analysis Standards Optimization Attention mechanism deep reinforcement learning (DRL) graph convolutional networks multi agent systems |
| Multi-Agent Uncertainty Sharing for Cooperative Multi-Agent Reinforcement Learning 会议论文 , 意大利, 2022-07 作者: Yang GK(杨光开); Chenhao(陈皓); Junge Zhang(张俊格); Qiyue Yin(尹奇跃); Kaiqi Huang(黄凯奇) Adobe PDF(2924Kb)  |  收藏  |  浏览/下载:229/49  |  提交时间:2022/07/12 |
| Efficient Exploration for Multi-Agent Reinforcement Learning via Transferable Successor Features 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 9, 页码: 1673-1686 作者: Wenzhang Liu; Lu Dong; Dan Niu; Changyin Sun Adobe PDF(5554Kb)  |  收藏  |  浏览/下载:135/60  |  提交时间:2022/08/19 Knowledge transfer multi-agent systems reinforcement learning successor features |