中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共3条，第1-3条

帮助

已选(0)清除条数/页：排序方式：
	稀疏奖励环境下基于自博弈框架的智能空战算法研究学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb) \| 收藏 \| 浏览/下载：22/1 \| 提交时间：2024/05/30 强化学习，离线强化学习，空战，智能决策，好奇心机制
	面向Ad-Hoc协作的局部观测重建方法期刊论文中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb) \| 收藏 \| 浏览/下载：240/48 \| 提交时间：2022/06/16 多智能体深度强化学习信用分配 Ad-Hoc协作
	对抗场景中的智能体策略泛化研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb) \| 收藏 \| 浏览/下载：317/14 \| 提交时间：2022/06/16 深度强化学习多智能体策略泛化 Ad-Hoc 协作信用分配

中国科学院自动化研究所机构知识库