中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning 会议论文 , Queensland, Australia, 2023-6 作者: Yang, Chen; Yang, Guangkai; Chen, Hao; Zhang, Junge Adobe PDF(3027Kb) \| 收藏 \| 浏览/下载：64/22 \| 提交时间：2024/05/29
	Large sequence models for sequential decision-making: a survey 期刊论文 FRONTIERS OF COMPUTER SCIENCE, 2023, 卷号: 17, 期号: 6, 页码: 18 作者: Wen, Muning; Lin, Runji; Wang, Hanjing; Yang, Yaodong; Wen, Ying; Mai, Luo; Wang, Jun; Zhang, Haifeng; Zhang, Weinan Adobe PDF(1351Kb) \| 收藏 \| 浏览/下载：154/5 \| 提交时间：2023/11/17 sequential decision-making sequence modeling the Transformer training system

中国科学院自动化研究所机构知识库