已选(0)清除
条数/页: 排序方式: |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:292/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:185/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| MiaoSuan Wargame: A Multi-Mode Integrated Platform for Imperfect Information Game 会议论文 , Beijing, China, August 21-24, 2022 作者: Jiale Xu; Jian Hu; Shixian Wang; Xuyang Yang; Wancheng Ni Adobe PDF(726Kb)  |  收藏  |  浏览/下载:61/17  |  提交时间:2023/06/28 open platform human-computer gaming AI evaluation Turing test imperfect information game wargame |
| 基于混合更新Q值的深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:186/5  |  提交时间:2020/06/10 深度强化学习 Q 学习算法 过估计 欠估计 Actor-Critic 凸组合 混合更新 |
| Mixing Update Q-value for Deep Reinforcement Learning 会议论文 , Budapest, Hungary, 2019/7/14-19 作者: Li Zhunan; Hou Xinwen 浏览  |  Adobe PDF(468Kb)  |  收藏  |  浏览/下载:157/64  |  提交时间:2020/06/10 |