CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

已选(0)清除 条数/页:   排序方式:
基于视觉表征的深度强化学习方法 学位论文
, 2024
作者:  刘民颂
Adobe PDF(10778Kb)  |  收藏  |  浏览/下载:55/4  |  提交时间:2024/06/22
深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:93/7  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
基于时序图推理的设备剩余使用寿命预测 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 76-88
作者:  刘雨蒙;  郑旭;  田玲;  王宏安
Adobe PDF(1550Kb)  |  收藏  |  浏览/下载:109/36  |  提交时间:2024/04/12
剩余使用寿命  时序图推理  图神经网络  深度推理网络  
基于表示学习和对手建模的动态博弈系统策略生成技术研究 学位论文
, 2023
作者:  詹员
Adobe PDF(12738Kb)  |  收藏  |  浏览/下载:139/8  |  提交时间:2023/06/06
深度强化学习  表示学习  对手建模  空中博弈  
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
作者:  张丰一
Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:226/6  |  提交时间:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:321/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
机器人持续性策略学习算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  熊方舟
Adobe PDF(3642Kb)  |  收藏  |  浏览/下载:361/18  |  提交时间:2020/06/09
持续学习  策略学习  机器人  灾难性遗忘  状态基元