中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共4条，第1-4条

帮助

已选(0)清除条数/页：排序方式：
	稀疏奖励环境下基于自博弈框架的智能空战算法研究学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb) \| 收藏 \| 浏览/下载：22/1 \| 提交时间：2024/05/30 强化学习，离线强化学习，空战，智能决策，好奇心机制
	基于不确定度的多智能体信用分配方法期刊论文中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb) \| 收藏 \| 浏览/下载：494/83 \| 提交时间：2022/07/12
	对抗环境中基于值分解框架的多智能体协同算法研究学位论文工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb) \| 收藏 \| 浏览/下载：235/7 \| 提交时间：2022/06/13 多智能体协同，信用分配，贝叶斯超网络，部分可观测约束，贝叶斯神经网络
	基于混合更新Q值的深度强化学习方法研究学位论文工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb) \| 收藏 \| 浏览/下载：198/5 \| 提交时间：2020/06/10 深度强化学习 Q 学习算法过估计欠估计 Actor-Critic 凸组合混合更新

中国科学院自动化研究所机构知识库