验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

学术期刊 [3]

多模态人工智能系统全... [1]

复杂系统认知与决策实... [1]

作者

文献类型

期刊论文 [5]

发表日期

语种

出处

自动化学报 [3]

中国科学院大学学报 [1]

控制理论与应用 [1]

资助项目

National N... [1]

收录类别

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共5条，第1-5条

帮助

限定条件

文献类型：期刊论文

已选(0)清除条数/页：排序方式：
	基于因果建模的强化学习控制:现状及展望期刊论文自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677 作者: 孙悦雯; 柳文章; 孙长银 Adobe PDF(1926Kb) \| 收藏 \| 浏览/下载：23/6 \| 提交时间：2024/05/09 强化学习控制因果发现因果推理迁移学习表示学习
	安全强化学习综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(1356Kb) \| 收藏 \| 浏览/下载：29/11 \| 提交时间：2024/04/24 安全强化学习约束马尔科夫决策过程学习过程学习目标离线强化学习
	基于优先采样模型的离线强化学习期刊论文自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb) \| 收藏 \| 浏览/下载：80/20 \| 提交时间：2024/04/12 离线强化学习优先采样模型时序差分误差鞅批约束深度Q学习
	基于不确定度的多智能体信用分配方法期刊论文中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb) \| 收藏 \| 浏览/下载：496/84 \| 提交时间：2022/07/12
	深度强化学习综述：兼论计算机围棋的发展期刊论文控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717 作者: 赵冬斌; 邵坤; 朱圆恒; 李栋; 陈亚冉; 王海涛; 刘德荣; 周彤; 王成红浏览 \| Adobe PDF(2816Kb) \| 收藏 \| 浏览/下载：1777/653 \| 提交时间：2017/09/13 深度强化学习初弈号深度学习强化学习人工智能

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25216
全文量13167
访问量5365898
下载量822931

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495