已选(0)清除
条数/页: 排序方式: |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 事件因果关系挖掘关键技术研究 学位论文 , 2024 作者: 何致涛 Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28 事件因果关系识别 事件因果关系解释生成 预训练语言模型 多智能体 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明 Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文 , 中国重庆, 2024-5-7 作者: Niu LY(钮龙宇); Wan J(万军) Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/28 |
| 融合专家知识与强化学习的自动驾驶策略研究 学位论文 , 2024 作者: 王宇霄 Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28 自动驾驶,深度模仿学习,深度强化学习,图神经网络 |
| 基于深度学习的视频片段拷贝检测技术研究 学位论文 , 2024 作者: 张驰 Adobe PDF(23128Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28 版权保护 视频片段拷贝检测 深度学习 |
| 面向高仿真场景的深度强化学习算法研究 学位论文 , 2024 作者: 钮龙宇 Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 深度强化学习 高仿真场景 分层学习 模仿学习 表征学习 |
| 面向表格数据的语义解析泛化技术研究 学位论文 , 2024 作者: 孙润鑫 Adobe PDF(2868Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 自然语言处理 语义解析 文本到SQL 泛化能力 |
| Learning Causal Dynamics Models in Object-Oriented Environments 会议论文 Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21 作者: Yu ZY(余忠蔚); Ruan JQ(阮景晴); Xing DP(邢登鹏) Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 强化学习 因果模型 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |