验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决... [154]

多模态人工智能系统全... [3]

紫东太初大模型研究中... [1]

模式识别实验室 [1]

作者

文献类型

期刊论文 [75]

会议论文 [69]

学位论文 [10]

发表日期

语种

出处

IEEE TRANS... [4]

IEEE Trans... [3]

INTERNATIO... [3]

0 [2]

BIOMIMETIC... [2]

Biomimetic... [2]

资助项目

National N... [3]

National N... [3]

National N... [3]

National N... [3]

ARO[W911NF... [2]

Beijing Mu... [2]

收录类别

EI [52]

导师

资助机构

National ... [23]

National K... [8]

National K... [5]

Strategic ... [5]

Strategic ... [3]

Beijing Mu... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共154条，第1-10条

帮助

限定条件	专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu; Haifeng Zhang; Jun Wang Adobe PDF(1339Kb) \| 收藏 \| 浏览/下载：19/4 \| 提交时间：2024/07/12
	Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb) \| 收藏 \| 浏览/下载：30/12 \| 提交时间：2024/07/05 reinforcement learning exploration efficiency space reduction
	On the Effects of Structural Modeling for Neural Semantic Parsing 会议论文 Proceedings of the 27th Conference on Computational Natural Language Learning (CoNLL), Singapore, Singapore, 2023-12 作者: Zhang X(张翔); He SZ(何世柱); Liu K(刘康); Zhao J(赵军) Adobe PDF(730Kb) \| 收藏 \| 浏览/下载：32/19 \| 提交时间：2024/06/27
	Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang; Zhang Hongming; Xing Dengpeng; Bo Xu Adobe PDF(9639Kb) \| 收藏 \| 浏览/下载：19/9 \| 提交时间：2024/06/25
	A Double-Observation Policy Learning Framework for Multi-target Coverage with Connectivity Maintenance 会议论文 , online, 2022-2 作者: Xu YF(徐一凡); Pu ZQ(蒲志强); Wu SG(吴士广); Liu BY(刘博寅); Yi JQ(易建强); Geng HJ(耿虎军); Chai XH(柴兴华) Adobe PDF(9582Kb) \| 收藏 \| 浏览/下载：20/5 \| 提交时间：2024/06/21
	MoDE-CoTD: Chain-of-Thought Distillation for Complex Reasoning Tasks with Mixture of Decoupled LoRA-Experts 会议论文 , Torino (Italia), 2024.5.20 - 2024.5.25 作者: Xiang Li; Shizhu He; Jiayu Wu; Zhao Yang; Yao Xu; Yang Jun; Haifeng Liu; Kang Liu; Jun Zhao Adobe PDF(1062Kb) \| 收藏 \| 浏览/下载：30/6 \| 提交时间：2024/06/20
	Learning Robust Communication by Adversarial Training in Networked System Control 期刊论文 Lecture Notes in Electrical Engineering, 2024, 页码: Chapter 52 978-981-97-3335-4 作者: Runji, Lin; Haifeng, Zhang Adobe PDF(8334Kb) \| 收藏 \| 浏览/下载：41/16 \| 提交时间：2024/06/11 Networked System Control Robustness Communicative Multi-Agent Reinforcement Learning
	Filtered Observations for Model-Based Multi-agent Reinforcement Learning 会议论文 , Turin, Italy, 2023.9.18-2023.9.22 作者: Meng Linghui; Xiong Xuantang; Zang Yifan; Zhang Xi; Li Guoqi; Xing Dengpeng; Xu Bo Adobe PDF(841Kb) \| 收藏 \| 浏览/下载：42/17 \| 提交时间：2024/06/11
	Learn to flap: foil non-parametric path planning via deep reinforcement learning 期刊论文 Journal of Fluid Mechanics, 2024, 卷号: 984, 页码: A9 作者: Wang, Zhipeng; Lin, Runji; Zhao, Zhiyu; Chen, Xu; Guo, Pengming; Yang, Ning; Wang,Zhicheng; Fan, Dixia Adobe PDF(1892Kb) \| 收藏 \| 浏览/下载：47/11 \| 提交时间：2024/06/07
	A Fish-like Binocular Vision System for Underwater Perception of Robotic Fish 期刊论文 Biomimetics, 2024, 页码: 171 作者: Tong Ru; Wu Zhengxing; Wang Jinge; Huang Yupei; Chen Di; Yu Junzhi Adobe PDF(4134Kb) \| 收藏 \| 浏览/下载：39/15 \| 提交时间：2024/06/06

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25785
全文量13666
访问量5720268
下载量891013

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495