CASIA OpenIR

Browse/Search Results:  1-10 of 13 Help

Selected(0)Clear Items/Page:    Sort:
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈皓
Adobe PDF(13782Kb)  |  Favorite  |  View/Download:51/3  |  Submit date:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴士广
Adobe PDF(14260Kb)  |  Favorite  |  View/Download:92/7  |  Submit date:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张朋朋
Adobe PDF(9752Kb)  |  Favorite  |  View/Download:47/4  |  Submit date:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴哲
Adobe PDF(6758Kb)  |  Favorite  |  View/Download:42/3  |  Submit date:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
Authors:  杨光开
Adobe PDF(17847Kb)  |  Favorite  |  View/Download:57/4  |  Submit date:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
Authors:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  Favorite  |  View/Download:57/2  |  Submit date:2022/07/12
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
Authors:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  Favorite  |  View/Download:25/2  |  Submit date:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  郭龙腾
Adobe PDF(6291Kb)  |  Favorite  |  View/Download:113/14  |  Submit date:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
多智能体博弈对抗的协同行为自学习算法与应用 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  董宗宽
Adobe PDF(4970Kb)  |  Favorite  |  View/Download:113/7  |  Submit date:2021/06/20
多智能体深度强化学习  协同行为学习  语言几何学  可解释性  Z学习  
基于深度强化学习的游戏智能决策 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  邵坤
Adobe PDF(13984Kb)  |  Favorite  |  View/Download:732/22  |  Submit date:2019/06/27
深度强化学习  深度学习  强化学习  智能决策  游戏人工智能  多智能体系统