CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:37/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:209/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:331/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
作者:  杨光开
Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:244/7  |  提交时间:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
高超声速飞行器不确定性抑制控制方法研究 学位论文
工学博士, 北京: 中国科学院大学, 2021
作者:  孙金林
Adobe PDF(18036Kb)  |  收藏  |  浏览/下载:287/1  |  提交时间:2021/06/28
高超声速飞行器  不确定性抑制  自适应模糊控制  抗干扰控制  有限时间控制  
基于深度强化学习的群体协同决策关键问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  王彗木
Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:309/1  |  提交时间:2021/06/24
群体系统  协同决策  多智能体系统  深度强化学习  图卷积网络  注 意力机制  
基于演化学习与对手策略的不完美信息博弈算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  张蒙
Adobe PDF(2515Kb)  |  收藏  |  浏览/下载:372/9  |  提交时间:2021/06/20
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成