已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于序列展开模型的多智能体方法研究 学位论文 , 2024 作者: Luo ZX(罗正昕) Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/30 多智能体 强化学习 序列展开模型 信度分配 非平稳性 |
| 基于目标条件强化学习的无监督技能发现方法研究 学位论文 , 2024 作者: 张天 Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30 目标 稀疏奖励 无监督强化学习 探索 技能策略 |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 面向可泛化、可解释强化学习的因果环境建模 学位论文 , 2024 作者: 余忠蔚 Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28 强化学习 因果推理 环境模型 |
| 多智能体策略一致性奖励塑造算法研究 学位论文 , 2024 作者: 杨晨 Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/27 多智能体系统 深度强化学习 信用分配 奖励塑造 |
| 复杂对抗条件下对手意图识别关键技术研究 学位论文 , 2023 作者: 徐佳乐 Adobe PDF(3048Kb)  |  收藏  |  浏览/下载:179/10  |  提交时间:2023/06/28 不完美信息博弈 多智能体策略博弈 对手意图识别 知识与数据融合 事件图态势建模 |
| 全局信息指导下的分布式多智能体协作算法研究 学位论文 , 2023 作者: 陈逸群 Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:103/3  |  提交时间:2023/06/27 强化学习,多智能体协作,全局信息,知识蒸馏 |
| 足球比赛态势智能分析与决策辅助方法研究 学位论文 , 2023 作者: 陈敏 Adobe PDF(8212Kb)  |  收藏  |  浏览/下载:91/3  |  提交时间:2023/06/27 足球 态势分析 深度学习 多智能体强化学习 迁移学习 |
| 融合信息素机制的大规模多智能体协同技术 学位论文 , 2023 作者: JiaHui Zhang Adobe PDF(5936Kb)  |  收藏  |  浏览/下载:171/3  |  提交时间:2023/06/26 大规模多智能体协同 多智能体强化学习 信息素机制 知识蒸馏 |