已选(0)清除
条数/页: 排序方式: |
| Tacit Commitments Emergence in Multi-agent Reinforcement Learning 会议论文 , New Delhi, India, 2023-7 作者: Liu BY(刘博寅); Zhiqiang Pu; Junlong Gao; Jianqiang Yi; Zhenyu Guo Adobe PDF(932Kb)  |  收藏  |  浏览/下载:28/10  |  提交时间:2024/07/15 |
| Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊 创刊日期: 2018, 主办者: Liu BY(刘博寅) Adobe PDF(5797Kb)  |  收藏  |  浏览/下载:31/8  |  提交时间:2024/07/12 |
| Learning to Play Football from Sports Perspective: A Knowledge-embedded Deep Reinforcement Learning Framework 期刊论文 IEEE Transactions on Games, 2022, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(2957Kb)  |  收藏  |  浏览/下载:40/10  |  提交时间:2024/07/12 |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(6675Kb)  |  收藏  |  浏览/下载:29/5  |  提交时间:2024/07/12 |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:60/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks 会议论文 , Queensland, Australia, 2023-6 作者: Hu GZ(胡光政); Li HR(李浩然); Liu SS(刘莎莎); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(2785Kb)  |  收藏  |  浏览/下载:41/11  |  提交时间:2024/07/04 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:44/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| Humor Detection System for MuSE 2023: Contextual Modeling, Pseudo Labelling, and Post-smoothing 会议论文 , 加拿大多伦多, 2023-11 作者: Xu MY(徐名宇); Chen S(陈顺); Lian Z(连政); Liu B(刘斌) Adobe PDF(557Kb)  |  收藏  |  浏览/下载:42/16  |  提交时间:2024/06/27 |
| Self-Talk Responses to Users' Opinions and Challenge in Human Computer Dialog 会议论文 , Beijing, China, 2018-8-2 作者: Yang Minghao; Zhang Ke; NaShengRuoYang; Tao Jianhua Adobe PDF(540Kb)  |  收藏  |  浏览/下载:66/19  |  提交时间:2024/06/24 |
| Learning in bi-level markov games 会议论文 , Padua, Italy, 2022.7.18-2022.7.23 作者: Meng Linghui; Ruan Jingqing; Xing Dengpeng; Xu Bo Adobe PDF(1450Kb)  |  收藏  |  浏览/下载:54/23  |  提交时间:2024/06/11 |