已选(0)清除
条数/页: 排序方式: |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:44/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 基于强化学习的多无人机协同任务规划技术 学位论文 , 2024 作者: 张梦瑶 Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:98/0  |  提交时间:2024/07/04 多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥 Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:43/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| 面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文 , 2024 作者: 徐一凡 Adobe PDF(20521Kb)  |  收藏  |  浏览/下载:44/3  |  提交时间:2024/06/20 多目标覆盖任务 强化学习 迁移泛化 课程学习 域自适应 环境偏移 |
| 基于预训练模型的决策序列化建模研究 学位论文 , 2024 作者: 林润基 Adobe PDF(7811Kb)  |  收藏  |  浏览/下载:78/1  |  提交时间:2024/06/07 预训练模型 决策序列化 序列模型 |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬 Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:94/7  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| 基于序列展开模型的多智能体方法研究 学位论文 , 2024 作者: Luo ZX(罗正昕) Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:59/1  |  提交时间:2024/05/30 多智能体 强化学习 序列展开模型 信度分配 非平稳性 |
| 面向高仿真场景的深度强化学习算法研究 学位论文 , 2024 作者: 钮龙宇 Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:33/1  |  提交时间:2024/05/28 深度强化学习 高仿真场景 分层学习 模仿学习 表征学习 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:92/7  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:70/6  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |