已选(0)清除
条数/页: 排序方式: |
| 基于视觉表征的深度强化学习方法 学位论文 , 2024 作者: 刘民颂![](/image/person.jpg)
Adobe PDF(10778Kb)  |   收藏  |  浏览/下载:55/4  |  提交时间:2024/06/22 深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络 |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬![](/image/person.jpg)
Adobe PDF(37765Kb)  |   收藏  |  浏览/下载:93/7  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| 基于时序图推理的设备剩余使用寿命预测 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 76-88 作者: 刘雨蒙; 郑旭; 田玲; 王宏安
Adobe PDF(1550Kb)  |   收藏  |  浏览/下载:109/36  |  提交时间:2024/04/12 剩余使用寿命 时序图推理 图神经网络 深度推理网络 |
| 基于表示学习和对手建模的动态博弈系统策略生成技术研究 学位论文 , 2023 作者: 詹员![](/image/person.jpg)
Adobe PDF(12738Kb)  |   收藏  |  浏览/下载:139/8  |  提交时间:2023/06/06 深度强化学习 表示学习 对手建模 空中博弈 |
| 嵌入结构先验的机器人技能学习算法研究 学位论文 , 2022 作者: 张丰一![](/image/person.jpg)
Adobe PDF(16472Kb)  |   收藏  |  浏览/下载:226/6  |  提交时间:2023/01/12 技能学习 结构先验知识 机器人 状态表示学习 强化学习 |
| 平行交通系统中的预测与控制关键技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 戴星原![](/image/person.jpg)
Adobe PDF(14868Kb)  |   收藏  |  浏览/下载:321/12  |  提交时间:2022/10/09 平行交通系统 交通预测 交通控制 深度学习 强化学习 |
| 机器人持续性策略学习算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 熊方舟![](/image/person.jpg)
Adobe PDF(3642Kb)  |   收藏  |  浏览/下载:361/18  |  提交时间:2020/06/09 持续学习 策略学习 机器人 灾难性遗忘 状态基元 |