已选(0)清除
条数/页: 排序方式: |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 事件因果关系挖掘关键技术研究 学位论文 , 2024 作者: 何致涛 Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 事件因果关系识别 事件因果关系解释生成 预训练语言模型 多智能体 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明 Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| 融合专家知识与强化学习的自动驾驶策略研究 学位论文 , 2024 作者: 王宇霄 Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28 自动驾驶,深度模仿学习,深度强化学习,图神经网络 |
| 面向高仿真场景的深度强化学习算法研究 学位论文 , 2024 作者: 钮龙宇 Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 深度强化学习 高仿真场景 分层学习 模仿学习 表征学习 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:8/1  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 面向可泛化、可解释强化学习的因果环境建模 学位论文 , 2024 作者: 余忠蔚 Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 因果推理 环境模型 |
| 管道式任务型对话系统关键技术研究 学位论文 , 2024 作者: 邱俊彦 Adobe PDF(5583Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/27 任务型对话系统 对话状态跟踪 对话策略 自然语言生成 |
| 多智能体策略一致性奖励塑造算法研究 学位论文 , 2024 作者: 杨晨 Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/27 多智能体系统 深度强化学习 信用分配 奖励塑造 |