已选(0)清除
条数/页: 排序方式: |
| Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu Adobe PDF(4577Kb)  |  收藏  |  浏览/下载:25/11  |  提交时间:2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining. |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(6675Kb)  |  收藏  |  浏览/下载:29/5  |  提交时间:2024/07/12 |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:60/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu; Haifeng Zhang; Jun Wang Adobe PDF(1339Kb)  |  收藏  |  浏览/下载:32/10  |  提交时间:2024/07/12 |
| Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:49/22  |  提交时间:2024/07/05 reinforcement learning exploration efficiency space reduction |
| NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks 会议论文 , Queensland, Australia, 2023-6 作者: Hu GZ(胡光政); Li HR(李浩然); Liu SS(刘莎莎); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(2785Kb)  |  收藏  |  浏览/下载:40/11  |  提交时间:2024/07/04 |
| An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文 , 线上, 2020-5 作者: Liu MS(刘民颂); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(727Kb)  |  收藏  |  浏览/下载:32/14  |  提交时间:2024/07/04 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:44/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| Dynamic datasets and market environments for financial reinforcement learning 期刊论文 MACHINE LEARNING, 2024, 页码: 45 作者: Liu, Xiao-Yang; Xia, Ziyi; Yang, Hongyang; Gao, Jiechao; Zha, Daochen; Zhu, Ming; Wang, Christina Dan; Wang, Zhaoran; Guo, Jian 收藏  |  浏览/下载:8/0  |  提交时间:2024/07/03 Financial reinforcement learning FinRL Dynamic dataset Market environment AI4Finance Open finance |
| 面向算力网络的智慧调度综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103 作者: 李逸博; 李小平; 王爽; 蒋嶷川 Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:27/19  |  提交时间:2024/07/02 算力网络 云计算 边缘计算 资源调度 知识 |