验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

学术期刊 [19]

作者

文献类型

期刊论文 [19]

发表日期

语种

出处

IEEE/CAA J... [9]

自动化学报 [8]

Internatio... [1]

Machine In... [1]

资助项目

收录类别

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共19条，第1-10条

帮助

限定条件	专题：学术期刊第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu Adobe PDF(4577Kb) \| 收藏 \| 浏览/下载：9/4 \| 提交时间：2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining.
	基于表征学习的离线强化学习方法研究综述期刊论文自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb) \| 收藏 \| 浏览/下载：15/10 \| 提交时间：2024/07/02 强化学习离线强化学习表征学习历史经验数据分布偏移
	Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604 作者: Kun Jiang; Wenzhang Liu; Yuanda Wang; Lu Dong; Changyin Sun Adobe PDF(2128Kb) \| 收藏 \| 浏览/下载：41/15 \| 提交时间：2024/06/07 Latent variable model maximum entropy multi-agent reinforcement learning (MARL) multi-agent system
	无人机反应式扰动流体路径规划期刊论文自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287 作者: 吴健发; 王宏伦; 王延祥; 刘一恒 Adobe PDF(4624Kb) \| 收藏 \| 浏览/下载：44/18 \| 提交时间：2024/05/09 无人机反应式路径规划受约束扰动流体动态系统深度强化学习训练环境
	多智能体博弈、学习与控制期刊论文自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613 作者: 王龙; 黄锋 Adobe PDF(2088Kb) \| 收藏 \| 浏览/下载：32/11 \| 提交时间：2024/05/09 博弈论多智能体学习控制论强化学习人工智能
	机器人感知与控制关键技术及其智能制造应用期刊论文自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 494-513 作者: 王耀南; 江一鸣; 姜娇; 张辉; 谭浩然; 彭伟星; 吴昊天; 曾凯 Adobe PDF(40511Kb) \| 收藏 \| 浏览/下载：63/21 \| 提交时间：2024/05/09 机器人智能制造视觉感知智能控制系统应用信息物理系统
	基于终端诱导强化学习的航天器轨道追逃博弈期刊论文自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984 作者: 耿远卓; 袁利; 黄煌; 汤亮 Adobe PDF(3292Kb) \| 收藏 \| 浏览/下载：17/11 \| 提交时间：2024/05/09 航天器追逃智能博弈近端策略优化奖励函数设计终端诱导
	安全强化学习综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(1356Kb) \| 收藏 \| 浏览/下载：58/26 \| 提交时间：2024/04/24 安全强化学习约束马尔科夫决策过程学习过程学习目标离线强化学习
	异策略深度强化学习中的经验回放研究综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256 作者: 胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny Adobe PDF(4679Kb) \| 收藏 \| 浏览/下载：69/17 \| 提交时间：2024/04/18 深度强化学习异策略经验回放人工智能
	基于滚动时域强化学习的智能车辆侧向控制算法期刊论文自动化学报, 2023, 卷号: 49, 期号: 12, 页码: 2481-2492 作者: 张兴龙; 陆阳; 李文璋; 徐昕 Adobe PDF(7533Kb) \| 收藏 \| 浏览/下载：53/14 \| 提交时间：2024/04/17 滚动时域强化学习智能汽车侧向控制

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25786
全文量13667
访问量5736788
下载量893543

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495