中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

CASIA OpenIR

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang; Yang Yiming; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng; Xu Bo Adobe PDF(7948Kb) \| 收藏 \| 浏览/下载：35/14 \| 提交时间：2024/06/25 强化学习，分层强化学习
	Efficient Hierarchical Reinforcement Learning via Mutual Information Constrained Subgoal Discovery 会议论文 , 长沙, 2023-11 作者: Kaishen Wang; Jingqing Ruan; Qingyang Zhang; Dengpeng Xing Adobe PDF(2044Kb) \| 收藏 \| 浏览/下载：40/22 \| 提交时间：2024/05/28

中国科学院自动化研究所机构知识库