中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

CASIA OpenIR

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang; Zhang Hongming; Xing Dengpeng; Bo Xu Adobe PDF(9639Kb) \| 收藏 \| 浏览/下载：29/13 \| 提交时间：2024/06/25
	Learning Superior Cooperative Policy in Competitive Multi-team Reinforcement Learning 会议论文 , Gold Coast, Australia, 2023-6 作者: Qingxu Fu; Tenghai Qiu; Zhiqiang Pu; Jianqiang Yi; Xiaolin Ai; Wanmai Yuan Adobe PDF(25675Kb) \| 收藏 \| 浏览/下载：52/13 \| 提交时间：2024/06/05

中国科学院自动化研究所机构知识库