已选(0)清除
条数/页: 排序方式: |
| L2E: Learning to Exploit Your Opponent 会议论文 , 意大利 帕多瓦, 2022.07.18-2022.07.23 作者: Wu Zhe ; Li Kai ; Xu Hang; Zang Yifan; An Bo; Xing Junliang![](/image/person.jpg)
Adobe PDF(5676Kb)  |   收藏  |  浏览/下载:229/45  |  提交时间:2022/06/17 |
| 基于演化学习与对手策略的不完美信息博弈算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙![](/image/person.jpg)
Adobe PDF(2515Kb)  |   收藏  |  浏览/下载:374/9  |  提交时间:2021/06/20 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| 基于混合更新Q值的深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南![](/image/person.jpg)
Adobe PDF(3839Kb)  |   收藏  |  浏览/下载:211/5  |  提交时间:2020/06/10 深度强化学习 Q 学习算法 过估计 欠估计 Actor-Critic 凸组合 混合更新 |
| Learning Deep Decentralized Policy Network by Collective Rewards for Real-Time Combat Game 会议论文 , Macao, China, August 10-16, 2019 作者: Peixi Peng ; Junliang Xing ; Lili Cao; Lisen Mu; Chang Huang
浏览  |   Adobe PDF(762Kb)  |   收藏  |  浏览/下载:356/133  |  提交时间:2019/10/10 Multi-agent Learning Deep Decentralized Policy Network Real-time Combat Game |