已选(0)清除
条数/页: 排序方式: |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:187/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:217/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:431/68  |  提交时间:2022/07/12 |
| 基于演化学习与对手策略的不完美信息博弈算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙 Adobe PDF(2515Kb)  |  收藏  |  浏览/下载:360/9  |  提交时间:2021/06/20 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| 一种针对德州扑克AI的对手建模与策略集成框架 期刊论文 自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙; 李凯; 吴哲; 臧一凡; 徐航; 兴军亮 Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:351/94  |  提交时间:2021/06/21 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| Learning Deep Decentralized Policy Network by Collective Rewards for Real-Time Combat Game 会议论文 , Macao, China, August 10-16, 2019 作者: Peixi Peng; Junliang Xing; Lili Cao; Lisen Mu; Chang Huang 浏览  |  Adobe PDF(762Kb)  |  收藏  |  浏览/下载:324/118  |  提交时间:2019/10/10 Multi-agent Learning Deep Decentralized Policy Network Real-time Combat Game |