中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共4条，第1-4条

帮助

已选(0)清除条数/页：排序方式：
	Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang; Xu Bo Adobe PDF(8862Kb) \| 收藏 \| 浏览/下载：14/5 \| 提交时间：2024/06/25 强化学习，分层强化学习
	Token-level Direct Preference Optimization 会议论文 , Vienna, Austria, 2024/7/21-27 作者: Zeng,Yongcheng; Liu,Guoqing; Ma,Weiyu; Yang,Ning; Zhang,Haifeng; Wang,Jun Adobe PDF(883Kb) \| 收藏 \| 浏览/下载：51/16 \| 提交时间：2024/06/05
	Pseudo Labels Regularization for Imbalanced Partial-Label Learning 会议论文 , 韩国首尔, 2024年4月14-19 作者: Mingyu Xu; Zheng Lian; Bin Liu; Zerui Chen; Jianhua Tao Adobe PDF(918Kb) \| 收藏 \| 浏览/下载：53/21 \| 提交时间：2024/05/31
	Learning Causal Dynamics Models in Object-Oriented Environments 会议论文 Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21 作者: Yu ZY(余忠蔚); Ruan JQ(阮景晴); Xing DP(邢登鹏) Adobe PDF(2176Kb) \| 收藏 \| 浏览/下载：32/10 \| 提交时间：2024/05/28 强化学习因果模型

中国科学院自动化研究所机构知识库