已选(0)清除
条数/页: 排序方式: |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅![](/image/person.jpg)
Adobe PDF(11380Kb)  |   收藏  |  浏览/下载:42/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:39/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 基于强化学习的多无人机协同任务规划技术 学位论文 , 2024 作者: 张梦瑶![](/image/person.jpg)
Adobe PDF(2880Kb)  |   收藏  |  浏览/下载:81/0  |  提交时间:2024/07/04 多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 自然语言嵌入的深度强化学习探索方法研究 学位论文 , 2024 作者: 郭洲蕊![](/image/person.jpg)
Adobe PDF(7588Kb)  |   收藏  |  浏览/下载:38/1  |  提交时间:2024/06/26 深度强化学习 自然语言 探索 |
| Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang ; Xu Bo![](/image/person.jpg)
Adobe PDF(8862Kb)  |   收藏  |  浏览/下载:21/7  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang ; Yang Yiming ; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng ; Xu Bo![](/image/person.jpg)
Adobe PDF(7948Kb)  |   收藏  |  浏览/下载:35/14  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥![](/image/person.jpg)
Adobe PDF(16716Kb)  |   收藏  |  浏览/下载:38/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| 基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文 , 2024 作者: 王筱琦![](/image/person.jpg)
Adobe PDF(2737Kb)  |   收藏  |  浏览/下载:54/1  |  提交时间:2024/06/06 兵棋推演 模仿学习 强化学习 人机对抗 |
| 多柔性关节仿鱼推进系统优化与运动控制研究 学位论文 , 2024 作者: Lu Ben![](/image/person.jpg)
Adobe PDF(36135Kb)  |   收藏  |  浏览/下载:45/10  |  提交时间:2024/06/04 水下仿生机器人 多柔性关节 性能优化 转向运动控制 |