已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于序列展开模型的多智能体方法研究 学位论文 , 2024 作者: Luo ZX(罗正昕) Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/30 多智能体 强化学习 序列展开模型 信度分配 非平稳性 |
| 基于目标条件强化学习的无监督技能发现方法研究 学位论文 , 2024 作者: 张天 Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:12/0  |  提交时间:2024/05/30 目标 稀疏奖励 无监督强化学习 探索 技能策略 |
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 , 2024 作者: 付清旭 Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:12/1  |  提交时间:2024/05/29 大规模,群体系统,协同,决策,深度强化学习,多智能体系统 |
| 基于机理建模和数据驱动的机器人装配技能学习研究 学位论文 , 2024 作者: 严少华 Adobe PDF(6690Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/29 位姿测量 对准控制 强化学习 装入控制 装配技能学习 |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明 Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 面向可泛化、可解释强化学习的因果环境建模 学位论文 , 2024 作者: 余忠蔚 Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28 强化学习 因果推理 环境模型 |