CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
强化学习中环境建模误差问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  黄文振
Adobe PDF(69564Kb)  |  收藏  |  浏览/下载:176/7  |  提交时间:2022/01/11
基于模型的强化学习  深度强化学习  元学习  
基于演示示教的机器人技能模仿学习 学位论文
, 智能化大厦: 中科院自动化所, 2021
作者:  夏鹏程
Adobe PDF(16930Kb)  |  收藏  |  浏览/下载:224/12  |  提交时间:2021/06/18
演示示教  域自适应  轨迹模仿  深度强化学习  
基于值分解优化的多智能体深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  王凌霄
Adobe PDF(13415Kb)  |  收藏  |  浏览/下载:178/9  |  提交时间:2021/06/15
深度强化学习  多智能体系统  价值函数分解算法  图神经网络  
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:579/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
多智能体博弈对抗的协同行为自学习算法与应用 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  董宗宽
Adobe PDF(4970Kb)  |  收藏  |  浏览/下载:280/14  |  提交时间:2021/06/20
多智能体深度强化学习  协同行为学习  语言几何学  可解释性  Z学习  
基于深度强化学习的群体协同决策关键问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  王彗木
Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:272/1  |  提交时间:2021/06/24
群体系统  协同决策  多智能体系统  深度强化学习  图卷积网络  注 意力机制