已选(0)清除
条数/页: 排序方式: |
| 面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文 , 2024 作者: 徐一凡![](/image/person.jpg)
Adobe PDF(20521Kb)  |   收藏  |  浏览/下载:24/2  |  提交时间:2024/06/20 多目标覆盖任务 强化学习 迁移泛化 课程学习 域自适应 环境偏移 |
| 基于预训练模型的决策序列化建模研究 学位论文 , 2024 作者: 林润基![](/image/person.jpg)
Adobe PDF(7811Kb)  |   收藏  |  浏览/下载:53/0  |  提交时间:2024/06/07 预训练模型 决策序列化 序列模型 |
| 基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文 , 2024 作者: 王筱琦![](/image/person.jpg)
Adobe PDF(2737Kb)  |   收藏  |  浏览/下载:36/1  |  提交时间:2024/06/06 兵棋推演 模仿学习 强化学习 人机对抗 |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬![](/image/person.jpg)
Adobe PDF(37765Kb)  |   收藏  |  浏览/下载:54/5  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 , 2024 作者: 付清旭![](/image/person.jpg)
Adobe PDF(39071Kb)  |   收藏  |  浏览/下载:43/6  |  提交时间:2024/05/29 大规模,群体系统,协同,决策,深度强化学习,多智能体系统 |
| 灵巧手机器人的类人物体交接学习研究 学位论文 , 2024 作者: 段昊男![](/image/person.jpg)
Adobe PDF(51787Kb)  |   收藏  |  浏览/下载:31/2  |  提交时间:2024/05/29 机器人学习 人机交互 物体交接 灵巧手机器人 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明![](/image/person.jpg)
Adobe PDF(19731Kb)  |   收藏  |  浏览/下载:34/5  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉![](/image/person.jpg)
Adobe PDF(6367Kb)  |   收藏  |  浏览/下载:60/6  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 管道式任务型对话系统关键技术研究 学位论文 , 2024 作者: 邱俊彦![](/image/person.jpg)
Adobe PDF(5583Kb)  |   收藏  |  浏览/下载:21/3  |  提交时间:2024/05/27 任务型对话系统 对话状态跟踪 对话策略 自然语言生成 |
| 面向平行交通系统的城市交通控制基础模型关键技术 学位论文 , 2024 作者: 赵宸![](/image/person.jpg)
Adobe PDF(6234Kb)  |   收藏  |  浏览/下载:39/5  |  提交时间:2024/05/27 平行交通系统 交通控制 平行学习 强化学习 基础模型 |