CASIA OpenIR

Browse/Search Results:  1-10 of 28 Help

Selected(0)Clear Items/Page:    Sort:
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈皓
Adobe PDF(13782Kb)  |  Favorite  |  View/Download:23/1  |  Submit date:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴士广
Adobe PDF(14260Kb)  |  Favorite  |  View/Download:41/3  |  Submit date:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张朋朋
Adobe PDF(9752Kb)  |  Favorite  |  View/Download:17/2  |  Submit date:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
基于平行学习的混合智能调控方法与应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李小双
Adobe PDF(10128Kb)  |  Favorite  |  View/Download:33/2  |  Submit date:2022/06/20
平行学习  混合智能调控  示教数据  模仿学习  深度强化学习  
知识数据混合驱动的策略学习及在兵棋决策中的运用 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  刘轩
Adobe PDF(3837Kb)  |  Favorite  |  View/Download:18/2  |  Submit date:2022/06/17
复杂对抗环境  认知智能  知识数据混合驱动  状态回溯  分层决策  陆战兵棋  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈筱语
Adobe PDF(23947Kb)  |  Favorite  |  View/Download:22/1  |  Submit date:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习  
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
Authors:  杨光开
Adobe PDF(17847Kb)  |  Favorite  |  View/Download:39/2  |  Submit date:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
Authors:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  Favorite  |  View/Download:40/1  |  Submit date:2022/07/12
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
Authors:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  Favorite  |  View/Download:13/2  |  Submit date:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
Authors:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  Favorite  |  View/Download:25/6  |  Submit date:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能