已选(0)清除
条数/页: 排序方式: |
| Safe Efficient Policy Optimization Algorithm for Unsignalized Intersection Navigation 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 9, 页码: 2011-2026 作者: Xiaolong Chen ; Biao Xu; Manjiang Hu; Yougang Bian; Yang Li; Xin Xu
Adobe PDF(5707Kb)  |   收藏  |  浏览/下载:2/0  |  提交时间:2024/08/09 Autonomous driving decision-making reinforcement learning (RL) unsignalized intersection |
| Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu
Adobe PDF(4577Kb)  |   收藏  |  浏览/下载:27/12  |  提交时间:2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining. |
| Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊 创刊日期: 2018, 主办者: Liu BY(刘博寅)
Adobe PDF(5797Kb)  |   收藏  |  浏览/下载:31/8  |  提交时间:2024/07/12 |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅)![](/image/person.jpg)
Adobe PDF(6675Kb)  |   收藏  |  浏览/下载:29/5  |  提交时间:2024/07/12 |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅![](/image/person.jpg)
Adobe PDF(11380Kb)  |   收藏  |  浏览/下载:60/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu ; Haifeng Zhang; Jun Wang
Adobe PDF(1339Kb)  |   收藏  |  浏览/下载:33/10  |  提交时间:2024/07/12 |
| VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文 , Canada, 2023 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(1199Kb)  |   收藏  |  浏览/下载:37/8  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文 , 线上, 2020-5 作者: Liu MS(刘民颂) ; Zhu YH(朱圆恒) ; Zhao DB(赵冬斌)![](/image/person.jpg)
Adobe PDF(727Kb)  |   收藏  |  浏览/下载:34/14  |  提交时间:2024/07/04 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:44/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |