验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策... [48]

多模态人工智能系统全... [1]

紫东太初大模型研究中... [1]

数字内容技术与服务研... [1]

模式识别实验室 [1]

作者

文献类型

会议论文 [25]

期刊论文 [16]

学位论文 [6]

发表日期

语种

出处

ACM Transa... [1]

APPLIED SC... [1]

APPLIED SO... [1]

Advanced I... [1]

IEEE ACCES... [1]

资助项目

National N... [3]

National N... [2]

National N... [2]

Advance Re... [1]

Fujian Pro... [1]

National K... [1]

收录类别

EI [20]

导师

资助机构

National N... [4]

National K... [2]

Advance Re... [1]

Fujian Pro... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共48条，第1-10条

帮助

限定条件	专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊创刊日期: 2018, 主办者: Liu BY(刘博寅) Adobe PDF(5797Kb) \| 收藏 \| 浏览/下载：23/5 \| 提交时间：2024/07/12
	Target-Embedding Autoencoder With Knowledge Distillation for Multi-Label Classification 期刊论文 IEEE TRANSACTIONS ON EMERGING TOPICS IN COMPUTATIONAL INTELLIGENCE, 2024, 页码: 12 作者: Ma, Ying; Zou, Xiaoyan; Pan, Qizheng; Yan, Ming; Li, Guoqi 收藏 \| 浏览/下载：12/0 \| 提交时间：2024/07/03 Multi-label classification knowledge distillation autoencoder label embedding
	On the Effects of Structural Modeling for Neural Semantic Parsing 会议论文 Proceedings of the 27th Conference on Computational Natural Language Learning (CoNLL), Singapore, Singapore, 2023-12 作者: Zhang X(张翔); He SZ(何世柱); Liu K(刘康); Zhao J(赵军) Adobe PDF(730Kb) \| 收藏 \| 浏览/下载：35/19 \| 提交时间：2024/06/27
	Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang; Xu Bo Adobe PDF(8862Kb) \| 收藏 \| 浏览/下载：21/7 \| 提交时间：2024/06/25 强化学习，分层强化学习
	MULFE: A Multi-Level Benchmark for Free Text Model Editing 会议论文 , Bangkok, Thailand, 2024-08 作者: Wang, Chenhao; Cao, Pengfei; Jin, Zhuoran; Chen, Yubo; Zeng, Daojian; Liu, Kang; Zhao, Jun Adobe PDF(571Kb) \| 收藏 \| 浏览/下载：23/9 \| 提交时间：2024/06/25
	Power Control Based on Deep Reinforcement Learning for Spectrum Sharing 期刊论文 IEEE Transactions on Wireless Communications, 2024, 卷号: 19, 期号: 6, 页码: 4209-4219 作者: Zhang,Haijun; Yang,Ning; Huangfu,Wei; Long,Keping; Leung,VictorCM Adobe PDF(1925Kb) \| 收藏 \| 浏览/下载：43/17 \| 提交时间：2024/06/12
	M3: Modularization for Multi-task and Multi-agent Offline Pre-training 会议论文 , London, United Kingdom, 2023.5.29-2023.6.2 作者: Meng Linghui; Ruan Jingqing; Xiong Xuantang; Li Xiyun; Zhang Xi; Xing Dengpeng; Xu Bo Adobe PDF(1302Kb) \| 收藏 \| 浏览/下载：34/10 \| 提交时间：2024/06/11
	Alignment Rationale for Natural Language Inference 会议论文 , Online, 2021-8-1 作者: Zhongtao Jiang; Yuanzhe Zhang; Zhao Yang; Jun Zhao; Kang Liu Adobe PDF(1280Kb) \| 收藏 \| 浏览/下载：42/14 \| 提交时间：2024/06/06
	Token-level Direct Preference Optimization 会议论文 , Vienna, Austria, 2024/7/21-27 作者: Zeng,Yongcheng; Liu,Guoqing; Ma,Weiyu; Yang,Ning; Zhang,Haifeng; Wang,Jun Adobe PDF(883Kb) \| 收藏 \| 浏览/下载：66/22 \| 提交时间：2024/06/05
	Advancing Air Combat Tactics with Improved Neural Fictitious Self-Play Reinforcement Learning 会议论文 Advanced Intelligent Computing Technology and Applications, 中国郑州, 2023-8 作者: He SQ(何少钦); Gao Y(高阳); Zhang BF(张保丰); Chang H(常惠); Zhang XC(张鑫辰) Adobe PDF(1496Kb) \| 收藏 \| 浏览/下载：61/21 \| 提交时间：2024/05/31 Air Combat, Reinforcement Learning, Neural Fictitious Self-Play.

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25835
全文量13670
访问量5753789
下载量897008

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495