验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决... [177]

多模态人工智能系统全... [5]

紫东太初大模型研究中... [2]

复杂系统管理与控制国... [1]

模式识别实验室 [1]

作者

文献类型

期刊论文 [73]

会议论文 [70]

学位论文 [33]

发表日期

语种

出处

INTERNATIO... [5]

IEEE TRANS... [4]

IEEE TRANS... [3]

IEEE TRANS... [2]

IEEE TRANS... [2]

资助项目

National N... [9]

National N... [7]

National N... [5]

Chinese Ac... [3]

National N... [3]

ARO[W911NF... [2]

收录类别

EI [55]

中文核心期刊要目总览 [1]

导师

资助机构

National ... [21]

National K... [8]

Strategic ... [4]

Beijing Na... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共177条，第1-10条

帮助

限定条件	专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊创刊日期: 2018, 主办者: Liu BY(刘博寅) Adobe PDF(5797Kb) \| 收藏 \| 浏览/下载：23/5 \| 提交时间：2024/07/12
	QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(6675Kb) \| 收藏 \| 浏览/下载：17/2 \| 提交时间：2024/07/12
	Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu; Haifeng Zhang; Jun Wang Adobe PDF(1339Kb) \| 收藏 \| 浏览/下载：20/4 \| 提交时间：2024/07/12
	Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb) \| 收藏 \| 浏览/下载：35/15 \| 提交时间：2024/07/05 reinforcement learning exploration efficiency space reduction
	On the Effects of Structural Modeling for Neural Semantic Parsing 会议论文 Proceedings of the 27th Conference on Computational Natural Language Learning (CoNLL), Singapore, Singapore, 2023-12 作者: Zhang X(张翔); He SZ(何世柱); Liu K(刘康); Zhao J(赵军) Adobe PDF(730Kb) \| 收藏 \| 浏览/下载：32/19 \| 提交时间：2024/06/27
	Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang; Zhang Hongming; Xing Dengpeng; Bo Xu Adobe PDF(9639Kb) \| 收藏 \| 浏览/下载：19/9 \| 提交时间：2024/06/25
	Power Control Based on Deep Reinforcement Learning for Spectrum Sharing 期刊论文 IEEE Transactions on Wireless Communications, 2024, 卷号: 19, 期号: 6, 页码: 4209-4219 作者: Zhang,Haijun; Yang,Ning; Huangfu,Wei; Long,Keping; Leung,VictorCM Adobe PDF(1925Kb) \| 收藏 \| 浏览/下载：42/17 \| 提交时间：2024/06/12
	Learning in bi-level markov games 会议论文 , Padua, Italy, 2022.7.18-2022.7.23 作者: Meng Linghui; Ruan Jingqing; Xing Dengpeng; Xu Bo Adobe PDF(1450Kb) \| 收藏 \| 浏览/下载：42/16 \| 提交时间：2024/06/11
	M3: Modularization for Multi-task and Multi-agent Offline Pre-training 会议论文 , London, United Kingdom, 2023.5.29-2023.6.2 作者: Meng Linghui; Ruan Jingqing; Xiong Xuantang; Li Xiyun; Zhang Xi; Xing Dengpeng; Xu Bo Adobe PDF(1302Kb) \| 收藏 \| 浏览/下载：32/9 \| 提交时间：2024/06/11
	Alignment Rationale for Natural Language Inference 会议论文 , Online, 2021-8-1 作者: Zhongtao Jiang; Yuanzhe Zhang; Zhao Yang; Jun Zhao; Kang Liu Adobe PDF(1280Kb) \| 收藏 \| 浏览/下载：41/14 \| 提交时间：2024/06/06

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25786
全文量13667
访问量5736752
下载量893536

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495