已选(0)清除
条数/页: 排序方式: |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 事件因果关系挖掘关键技术研究 学位论文 , 2024 作者: 何致涛 Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 事件因果关系识别 事件因果关系解释生成 预训练语言模型 多智能体 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明 Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| 融合专家知识与强化学习的自动驾驶策略研究 学位论文 , 2024 作者: 王宇霄 Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28 自动驾驶,深度模仿学习,深度强化学习,图神经网络 |
| 基于深度学习的视频片段拷贝检测技术研究 学位论文 , 2024 作者: 张驰 Adobe PDF(23128Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28 版权保护 视频片段拷贝检测 深度学习 |
| 面向高仿真场景的深度强化学习算法研究 学位论文 , 2024 作者: 钮龙宇 Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 深度强化学习 高仿真场景 分层学习 模仿学习 表征学习 |
| 面向表格数据的语义解析泛化技术研究 学位论文 , 2024 作者: 孙润鑫 Adobe PDF(2868Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 自然语言处理 语义解析 文本到SQL 泛化能力 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 面向可泛化、可解释强化学习的因果环境建模 学位论文 , 2024 作者: 余忠蔚 Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 因果推理 环境模型 |