中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

研究单元&专题

作者

文献类型

发表日期

语种

出处

资助项目

收录类别

导师

资助机构

CASIA OpenIR

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	安全强化学习综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(1356Kb) \| 收藏 \| 浏览/下载：68/29 \| 提交时间：2024/04/24 安全强化学习约束马尔科夫决策过程学习过程学习目标离线强化学习
	基于优先采样模型的离线强化学习期刊论文自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb) \| 收藏 \| 浏览/下载：119/30 \| 提交时间：2024/04/12 离线强化学习优先采样模型时序差分误差鞅批约束深度Q学习

中国科学院自动化研究所机构知识库