验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [160]

学术期刊 [88]

复杂系统认知与决策... [40]

作者

文献类型

期刊论文 [226]

学位论文 [81]

会议论文 [63]

发表日期

语种

出处

IEEE/CAA ... [61]

IEEE TRAN... [12]

Machine I... [12]

自动化学报 [12]

IEEE TRANS... [7]

IEEE TRANS... [7]

资助项目

National N... [5]

National N... [5]

Strategic ... [4]

Developmen... [3]

National N... [3]

National N... [3]

收录类别

EI [44]

导师

资助机构

National ... [27]

National ... [12]

Early Care... [9]

Beijing Na... [8]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共372条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu Adobe PDF(4577Kb) \| 收藏 \| 浏览/下载：14/6 \| 提交时间：2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining.
	Fixed-Time Gradient Flows for Solving Constrained Optimization: A Unified Approach 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 8, 页码: 1849-1864 作者: Xinli Shi; Xiangping Xu; Guanghui Wen; Jinde Cao Adobe PDF(2318Kb) \| 收藏 \| 浏览/下载：15/6 \| 提交时间：2024/07/16 Consensus constrained optimization disturbance rejection linear equations fixed-time gradient flow (FxTGF)
	基于深度强化学习的足球智能体球员策略方法研究学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb) \| 收藏 \| 浏览/下载：46/0 \| 提交时间：2024/07/12 足球多智能体系统深度强化学习互信息内在激励预训练
	Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu; Haifeng Zhang; Jun Wang Adobe PDF(1339Kb) \| 收藏 \| 浏览/下载：21/5 \| 提交时间：2024/07/12
	面向多模态语义理解与推理的视觉问答研究学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb) \| 收藏 \| 浏览/下载：42/2 \| 提交时间：2024/07/08 多模态视觉问答语义挖掘可靠关联推理泛化
	Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb) \| 收藏 \| 浏览/下载：37/15 \| 提交时间：2024/07/05 reinforcement learning exploration efficiency space reduction
	基于强化学习动作空间精简的时序决策任务算法研究学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb) \| 收藏 \| 浏览/下载：40/1 \| 提交时间：2024/07/04 时序决策强化学习动作空间约简分层强化学习动作掩码
	面向多机器人博弈的深度强化学习方法学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb) \| 收藏 \| 浏览/下载：39/0 \| 提交时间：2024/07/04 多智能体深度强化学习多机器人博弈极小极大Q学习值分解最大熵
	基于表征学习的离线强化学习方法研究综述期刊论文自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb) \| 收藏 \| 浏览/下载：15/10 \| 提交时间：2024/07/02 强化学习离线强化学习表征学习历史经验数据分布偏移
	面向算力网络的智慧调度综述期刊论文自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103 作者: 李逸博; 李小平; 王爽; 蒋嶷川 Adobe PDF(1752Kb) \| 收藏 \| 浏览/下载：20/14 \| 提交时间：2024/07/02 算力网络云计算边缘计算资源调度知识

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25851
全文量13686
访问量5776758
下载量900832

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495