验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策... [20]

紫东太初大模型研究中... [1]

数字内容技术与服务研... [1]

模式识别实验室 [1]

作者

文献类型

会议论文 [18]

期刊论文 [2]

发表日期

语种

出处

Advanced I... [1]

Machine In... [1]

Proceeding... [1]

资助项目

National N... [1]

收录类别

EI [20]

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共20条，第1-10条

帮助

限定条件	收录类别：EI 专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang; Xu Bo Adobe PDF(8862Kb) \| 收藏 \| 浏览/下载：21/7 \| 提交时间：2024/06/25 强化学习，分层强化学习
	Token-level Direct Preference Optimization 会议论文 , Vienna, Austria, 2024/7/21-27 作者: Zeng,Yongcheng; Liu,Guoqing; Ma,Weiyu; Yang,Ning; Zhang,Haifeng; Wang,Jun Adobe PDF(883Kb) \| 收藏 \| 浏览/下载：66/22 \| 提交时间：2024/06/05
	Advancing Air Combat Tactics with Improved Neural Fictitious Self-Play Reinforcement Learning 会议论文 Advanced Intelligent Computing Technology and Applications, 中国郑州, 2023-8 作者: He SQ(何少钦); Gao Y(高阳); Zhang BF(张保丰); Chang H(常惠); Zhang XC(张鑫辰) Adobe PDF(1496Kb) \| 收藏 \| 浏览/下载：61/21 \| 提交时间：2024/05/31 Air Combat, Reinforcement Learning, Neural Fictitious Self-Play.
	Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning 会议论文 , Queensland, Australia, 2023-6 作者: Yang, Chen; Yang, Guangkai; Chen, Hao; Zhang, Junge Adobe PDF(3027Kb) \| 收藏 \| 浏览/下载：61/22 \| 提交时间：2024/05/29
	Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning 会议论文 , New Orleans, LA, USA,, November 28 - December 9, 2022 作者: Zhiwei Xu; Dapeng Li; Bin Zhang; Yuan Zhan; Yunpeng Bai; Guoliang Fan Adobe PDF(4367Kb) \| 收藏 \| 浏览/下载：36/6 \| 提交时间：2024/05/28
	SIDE: State Inference for Partially Observable Cooperative Multi-Agent Reinforcement Learning 会议论文 , Auckland, New Zealand, May 9-13, 2022 作者: Zhiwei Xu; Yunpeng Bai; Dapeng Li; Bin Zhang; Guoliang Fan Adobe PDF(2965Kb) \| 收藏 \| 浏览/下载：37/7 \| 提交时间：2024/05/28
	PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文 Proceedings of the AAAI Conference on Artificial Intelligence, 美国华盛顿, 2023.02.07 - 2023.02.14 作者: Bai FS(白丰硕); Zhang HM(张鸿铭); Tao TY(陶天阳); Wu ZH(武志亨); Wang YN(王燕娜); Xu B(徐博) Adobe PDF(1663Kb) \| 收藏 \| 浏览/下载：206/47 \| 提交时间：2023/07/05 Reinforcement Learning Algorithms Transfer Domain Adaptation Multi-Task Learning
	UC-OWOD: Unknown-Classified Open World Object Detection 会议论文 , Tel Aviv, Israel, 2022-10 作者: Zhiheng Wu; Yue Lu; Xingyu Chen; Zhengxing Wu; Liwen Kang; Junzhi Yu Adobe PDF(2702Kb) \| 收藏 \| 浏览/下载：130/25 \| 提交时间：2023/06/29
	PKD: General Distillation Framework for Object Detectors via Pearson Correlation Coefficient 会议论文 , New Orleans, America, Monday November 28th through Friday December 9th 作者: Weihan, Cao; Yifan, Zhang; Jianfei, Gao; Anda, Cheng; Ke, Cheng; Jian, Cheng Adobe PDF(2614Kb) \| 收藏 \| 浏览/下载：126/35 \| 提交时间：2023/06/21 Knowledge Distillation Model Compression Object Detection
	VLP: A Survey on Vision-language Pre-training 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56 作者: Feilong Chen; Duzhen Zhang; Minglun Han; Xiuyi Chen; Jing Shi; Shuang Xu; Bo Xu Adobe PDF(969Kb) \| 收藏 \| 浏览/下载：176/34 \| 提交时间：2023/06/21

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25835
全文量13670
访问量5754804
下载量897261

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495