已选(0)清除
条数/页: 排序方式: |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:294/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 基于深度强化学习的群体协同决策方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴士广 Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:385/24  |  提交时间:2022/06/15 群体系统 协同决策 深度强化学习 多智能体强化学习 图注意力网络 |
| 基于关系网络的多智能体协同分层决策技术 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张朋朋 Adobe PDF(9752Kb)  |  收藏  |  浏览/下载:208/12  |  提交时间:2022/06/13 多智能体协同 关系网络 分层 热力图 可解释性 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:188/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:219/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:433/68  |  提交时间:2022/07/12 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:213/37  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |