已选(0)清除
条数/页: 排序方式: |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬![](/image/person.jpg)
Adobe PDF(37765Kb)  |   收藏  |  浏览/下载:83/7  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:46/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 , 2024 作者: 付清旭![](/image/person.jpg)
Adobe PDF(39071Kb)  |   收藏  |  浏览/下载:58/6  |  提交时间:2024/05/29 大规模,群体系统,协同,决策,深度强化学习,多智能体系统 |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超![](/image/person.jpg)
Adobe PDF(7255Kb)  |   收藏  |  浏览/下载:22/1  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 面向高仿真场景的深度强化学习算法研究 学位论文 , 2024 作者: 钮龙宇![](/image/person.jpg)
Adobe PDF(9528Kb)  |   收藏  |  浏览/下载:28/0  |  提交时间:2024/05/28 深度强化学习 高仿真场景 分层学习 模仿学习 表征学习 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟![](/image/person.jpg)
Adobe PDF(12464Kb)  |   收藏  |  浏览/下载:84/7  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉![](/image/person.jpg)
Adobe PDF(6367Kb)  |   收藏  |  浏览/下载:65/6  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 分层强化学习的子目标生成与探索策略 学位论文 , 2024 作者: 王开申![](/image/person.jpg)
Adobe PDF(8335Kb)  |   收藏  |  浏览/下载:45/0  |  提交时间:2024/05/27 分层强化学习,子目标生成,互信息,扩散模型 |
| 基于优先采样模型的离线强化学习 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松
Adobe PDF(2677Kb)  |   收藏  |  浏览/下载:109/26  |  提交时间:2024/04/12 离线强化学习 优先采样模型 时序差分误差 鞅 批约束深度Q学习 |