中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

CASIA OpenIR

（本次检索基于用户作品认领结果）

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文 , 线上, 2020-5 作者: Liu MS(刘民颂); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(727Kb) \| 收藏 \| 浏览/下载：36/15 \| 提交时间：2024/07/04
	基于视觉表征的深度强化学习方法学位论文 , 2024 作者: 刘民颂 Adobe PDF(10778Kb) \| 收藏 \| 浏览/下载：57/4 \| 提交时间：2024/06/22 深度强化学习，视觉表征学习，自监督学习，状态抽象，Transformer神经网络

中国科学院自动化研究所机构知识库