中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

研究单元&专题

作者

文献类型

发表日期

2024 [2]

语种

出处

资助项目

收录类别

导师

资助机构

CASIA OpenIR

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	基于表征学习的离线强化学习方法研究综述期刊论文自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb) \| 收藏 \| 浏览/下载：15/10 \| 提交时间：2024/07/02 强化学习离线强化学习表征学习历史经验数据分布偏移
	基于优先采样模型的离线强化学习期刊论文自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb) \| 收藏 \| 浏览/下载：113/28 \| 提交时间：2024/04/12 离线强化学习优先采样模型时序差分误差鞅批约束深度Q学习

中国科学院自动化研究所机构知识库