CASIA OpenIR

Browse/Search Results:  1-10 of 11 Help

Selected(0)Clear Items/Page:    Sort:
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈皓
Adobe PDF(13782Kb)  |  Favorite  |  View/Download:66/3  |  Submit date:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴士广
Adobe PDF(14260Kb)  |  Favorite  |  View/Download:136/12  |  Submit date:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张朋朋
Adobe PDF(9752Kb)  |  Favorite  |  View/Download:65/6  |  Submit date:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴哲
Adobe PDF(6758Kb)  |  Favorite  |  View/Download:55/3  |  Submit date:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
面向复杂对抗的对手行为预测关键技术研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
Authors:  siyuan xing
Adobe PDF(2745Kb)  |  Favorite  |  View/Download:42/4  |  Submit date:2022/06/15
兵棋,位置预测,时空建模,对手建模,异质图网络  
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
Authors:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  Favorite  |  View/Download:36/3  |  Submit date:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文
自动化学报, 2022, 页码: 0
Authors:  吴哲;  李凯;  徐航;  兴军亮
Adobe PDF(15953Kb)  |  Favorite  |  View/Download:54/8  |  Submit date:2022/06/17
基于演化学习与对手策略的不完美信息博弈算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  张蒙
Adobe PDF(2515Kb)  |  Favorite  |  View/Download:259/8  |  Submit date:2021/06/20
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成  
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
Authors:  唐振韬
Adobe PDF(23513Kb)  |  Favorite  |  View/Download:288/13  |  Submit date:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
一种针对德州扑克AI的对手建模与策略集成框架 期刊论文
自动化学报, 2021, 期号: 0, 页码: 0
Authors:  张蒙;  李凯;  吴哲;  臧一凡;  徐航;  兴军亮
Adobe PDF(1354Kb)  |  Favorite  |  View/Download:131/22  |  Submit date:2021/06/21
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成