已选(0)清除
条数/页: 排序方式: |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:7/4  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 基于视觉表征的深度强化学习方法 学位论文 , 2024 作者: 刘民颂![](/image/person.jpg)
Adobe PDF(10778Kb)  |   收藏  |  浏览/下载:36/4  |  提交时间:2024/06/22 深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络 |
| 面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文 , 2024 作者: 徐一凡![](/image/person.jpg)
Adobe PDF(20521Kb)  |   收藏  |  浏览/下载:32/3  |  提交时间:2024/06/20 多目标覆盖任务 强化学习 迁移泛化 课程学习 域自适应 环境偏移 |
| 面向交叉路口通行的自动驾驶强化学习方法 学位论文 , 2024 作者: 刘育琦![](/image/person.jpg)
Adobe PDF(24247Kb)  |   收藏  |  浏览/下载:18/4  |  提交时间:2024/06/03 深度强化学习 自动驾驶 交叉路口通行 场景集 安全强化学习 图卷积网络 |
| 基于目标条件强化学习的无监督技能发现方法研究 学位论文 , 2024 作者: 张天![](/image/person.jpg)
Adobe PDF(13799Kb)  |   收藏  |  浏览/下载:28/1  |  提交时间:2024/05/30 目标 稀疏奖励 无监督强化学习 探索 技能策略 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟![](/image/person.jpg)
Adobe PDF(12464Kb)  |   收藏  |  浏览/下载:79/7  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉![](/image/person.jpg)
Adobe PDF(6367Kb)  |   收藏  |  浏览/下载:63/6  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 基于因果建模的强化学习控制:现状及展望 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677 作者: 孙悦雯; 柳文章; 孙长银
Adobe PDF(1926Kb)  |   收藏  |  浏览/下载:40/10  |  提交时间:2024/05/09 强化学习控制 因果发现 因果推理 迁移学习 表示学习 |
| 面向运动目标跟踪的机械臂补偿学习控制技术研究 学位论文 , 2023 作者: 王丽丽![](/image/person.jpg)
Adobe PDF(9953Kb)  |   收藏  |  浏览/下载:171/9  |  提交时间:2023/06/02 视觉控制,运动目标操作,延时补偿,强化学习 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲![](/image/person.jpg)
Adobe PDF(6758Kb)  |   收藏  |  浏览/下载:213/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |