中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

CASIA OpenIR

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	面向连续控制任务的深度强化学习值函数估计研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强 Adobe PDF(4687Kb) \| 收藏 \| 浏览/下载：231/5 \| 提交时间：2022/06/17 深度强化学习值函数估计值函数表示集成强化学习
	对抗环境中基于值分解框架的多智能体协同算法研究学位论文工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb) \| 收藏 \| 浏览/下载：248/7 \| 提交时间：2022/06/13 多智能体协同，信用分配，贝叶斯超网络，部分可观测约束，贝叶斯神经网络

中国科学院自动化研究所机构知识库