已选(0)清除
条数/页: 排序方式: |
| Exploration via Joint Policy Diversity for Sparse-Reward Multi-Agent Tasks 会议论文 , Macao, China, 2023-8 作者: Pei Xu; Junge Zhang; Kaiqi Huang Adobe PDF(1369Kb)  |  收藏  |  浏览/下载:220/68  |  提交时间:2023/06/19 |
| Subspace-Aware Exploration for Sparse-Reward Multi-Agent Tasks 会议论文 , Washington DC, USA, 2023-2-7 作者: Pei Xu; Junge Zhang; Qiyue Yin; Chao Yu; Yaodong Yang; Kaiqi Huang Adobe PDF(2037Kb)  |  收藏  |  浏览/下载:193/60  |  提交时间:2023/06/19 deep reinforcement learning sparse reward exploration multi-agent |
| Deep Reinforcement Learning With Part-Aware Exploration Bonus in Video Games 期刊论文 IEEE TRANSACTIONS ON GAMES, 2022, 卷号: 14, 期号: 4, 页码: 644-653 作者: Xu, Pei; Yin, Qiyue; Zhang, Junge; Huang, Kaiqi Adobe PDF(1480Kb)  |  收藏  |  浏览/下载:289/71  |  提交时间:2023/02/22 Deep learning exploration reinforcement learning video game |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:294/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:188/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:213/37  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
| 一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文 自动化学报, 2022, 页码: 0 作者: 吴哲; 李凯; 徐航; 兴军亮 Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:184/43  |  提交时间:2022/06/17 |
| 基于演化学习与对手策略的不完美信息博弈算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙 Adobe PDF(2515Kb)  |  收藏  |  浏览/下载:360/9  |  提交时间:2021/06/20 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| 一种针对德州扑克AI的对手建模与策略集成框架 期刊论文 自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙; 李凯; 吴哲; 臧一凡; 徐航; 兴军亮 Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:352/94  |  提交时间:2021/06/21 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |