已选(0)清除
条数/页: 排序方式: |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(6675Kb)  |  收藏  |  浏览/下载:9/1  |  提交时间:2024/07/12 |
| NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks 会议论文 , Queensland, Australia, 2023-6 作者: Hu GZ(胡光政); Li HR(李浩然); Liu SS(刘莎莎); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(2785Kb)  |  收藏  |  浏览/下载:27/7  |  提交时间:2024/07/04 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| Adaptive Multi-Agent Coordination among Different Team Attribute Tasks via Contextual Meta-Reinforcement Learning 会议论文 , 河南开封, 2024年5月17-19日 作者: Huang, Shangjing; Zhao, Zijie; Zhu, Yuanheng; Zhao, Dongbin Adobe PDF(15515Kb)  |  收藏  |  浏览/下载:15/6  |  提交时间:2024/06/26 |
| Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang; Xu Bo Adobe PDF(8862Kb)  |  收藏  |  浏览/下载:14/5  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| A Brain-inspired Theory of Collective Mind Model for Efficient Social Cooperation 期刊论文 IEEE Transactions on Artificial Intelligence, 2024, 页码: 无 作者: Zhao,Zhuoya; Zhao,Feifei; Wang,Shiwen; Sun,Yinqian; Zeng,Yi Adobe PDF(2270Kb)  |  收藏  |  浏览/下载:14/11  |  提交时间:2024/06/25 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥 Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:31/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| Improving Generalization of Multi-agent Reinforcement Learning through Domain-Invariant Feature Extraction 会议论文 , Greece, 2023-5 作者: Xu YF(徐一凡); Pu ZQ(蒲志强); Cai QA(蔡奇昂); Li FM(李非墨); Chai XH(柴兴华) Adobe PDF(7610Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/06/21 |
| 面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文 , 2024 作者: 徐一凡 Adobe PDF(20521Kb)  |  收藏  |  浏览/下载:32/3  |  提交时间:2024/06/20 多目标覆盖任务 强化学习 迁移泛化 课程学习 域自适应 环境偏移 |