CASIA OpenIR

Browse/Search Results:  1-10 of 13 Help

Selected(0)Clear Items/Page:    Sort:
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈皓
Adobe PDF(13782Kb)  |  Favorite  |  View/Download:101/3  |  Submit date:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴士广
Adobe PDF(14260Kb)  |  Favorite  |  View/Download:164/12  |  Submit date:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张朋朋
Adobe PDF(9752Kb)  |  Favorite  |  View/Download:76/6  |  Submit date:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴哲
Adobe PDF(6758Kb)  |  Favorite  |  View/Download:74/3  |  Submit date:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
Authors:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  Favorite  |  View/Download:85/3  |  Submit date:2022/07/12
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
Authors:  杨光开
Adobe PDF(17847Kb)  |  Favorite  |  View/Download:89/4  |  Submit date:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
Authors:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  Favorite  |  View/Download:55/5  |  Submit date:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  郭龙腾
Adobe PDF(6291Kb)  |  Favorite  |  View/Download:138/15  |  Submit date:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
多智能体博弈对抗的协同行为自学习算法与应用 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  董宗宽
Adobe PDF(4970Kb)  |  Favorite  |  View/Download:136/7  |  Submit date:2021/06/20
多智能体深度强化学习  协同行为学习  语言几何学  可解释性  Z学习  
基于深度强化学习的游戏智能决策 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  邵坤
Adobe PDF(13984Kb)  |  Favorite  |  View/Download:753/23  |  Submit date:2019/06/27
深度强化学习  深度学习  强化学习  智能决策  游戏人工智能  多智能体系统