CASIA OpenIR

浏览/检索结果: 共2条,第1-2条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
作者:  杨光开
Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:248/7  |  提交时间:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
强化学习中环境建模误差问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  黄文振
Adobe PDF(69564Kb)  |  收藏  |  浏览/下载:197/8  |  提交时间:2022/01/11
基于模型的强化学习  深度强化学习  元学习