已选(0)清除
条数/页: 排序方式: |
| Improving Generalization of Multi-agent Reinforcement Learning through Domain-Invariant Feature Extraction 会议论文 , Greece, 2023-5 作者: Xu YF(徐一凡); Pu ZQ(蒲志强); Cai QA(蔡奇昂); Li FM(李非墨); Chai XH(柴兴华) Adobe PDF(7610Kb)  |  收藏  |  浏览/下载:27/12  |  提交时间:2024/06/21 |
| Token-level Direct Preference Optimization 会议论文 , Vienna, Austria, 2024/7/21-27 作者: Zeng,Yongcheng; Liu,Guoqing; Ma,Weiyu; Yang,Ning; Zhang,Haifeng; Wang,Jun Adobe PDF(883Kb)  |  收藏  |  浏览/下载:71/24  |  提交时间:2024/06/05 |
| 基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文 模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312 作者: 关伟凡; 张希 Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:145/49  |  提交时间:2023/06/29 强化学习 模仿学习 噪声对比估计 自适应权重 |
| AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning 会议论文 , 线上, 2022-02-22 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li JQ(李金秋); Li K(李凯); Xing JL(兴军亮) Adobe PDF(2593Kb)  |  收藏  |  浏览/下载:215/80  |  提交时间:2023/06/29 |
| Pseudo Value Network Distillation for High-Performance Exploration 会议论文 , 澳大利亚, 2023-06 作者: Zhao EM(赵恩民); Xing JL(兴军亮); Li K(李凯); Kang YX(康永欣); Tao P(陶品) Adobe PDF(5874Kb)  |  收藏  |  浏览/下载:162/46  |  提交时间:2023/06/28 |
| Learning to Play Hard Exploration Games Using Graph-guided Self-navigation 会议论文 , 线上, 2021-02 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li K(李凯); Li LJ(李丽娟); Xing JL(兴军亮) Adobe PDF(413Kb)  |  收藏  |  浏览/下载:186/66  |  提交时间:2023/06/28 |
| Exploration via Joint Policy Diversity for Sparse-Reward Multi-Agent Tasks 会议论文 , Macao, China, 2023-8 作者: Pei Xu; Junge Zhang; Kaiqi Huang Adobe PDF(1369Kb)  |  收藏  |  浏览/下载:279/87  |  提交时间:2023/06/19 |
| Automatic Curriculum Learning for Large-Scale Cooperative Multiagent Systems 期刊论文 IEEE Transactions on Emerging Topics in Computational Intelligence, 2023, 卷号: 7, 期号: 3, 页码: 912-930 作者: Zhang TL(张天乐); Liu Z(刘振); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(4728Kb)  |  收藏  |  浏览/下载:395/95  |  提交时间:2023/06/02 |
| 一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文 自动化学报, 2022, 页码: 0 作者: 吴哲; 李凯; 徐航; 兴军亮 Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:246/66  |  提交时间:2022/06/17 |
| L2E: Learning to Exploit Your Opponent 会议论文 , 意大利 帕多瓦, 2022.07.18-2022.07.23 作者: Wu Zhe; Li Kai; Xu Hang; Zang Yifan; An Bo; Xing Junliang Adobe PDF(5676Kb)  |  收藏  |  浏览/下载:231/46  |  提交时间:2022/06/17 |