CASIA OpenIR

浏览/检索结果: 共26条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:379/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
融合信息素机制的大规模多智能体协同技术 学位论文
, 2023
作者:  JiaHui Zhang
Adobe PDF(5936Kb)  |  收藏  |  浏览/下载:158/3  |  提交时间:2023/06/26
大规模多智能体协同  多智能体强化学习  信息素机制  知识蒸馏  
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
, 2023
作者:  白云鹏
Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:152/9  |  提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心  
基于表示学习和对手建模的动态博弈系统策略生成技术研究 学位论文
, 2023
作者:  詹员
Adobe PDF(12738Kb)  |  收藏  |  浏览/下载:125/8  |  提交时间:2023/06/06
深度强化学习  表示学习  对手建模  空中博弈  
面向稀疏奖励任务的深度强化学习探索方法研究 学位论文
, 2023
作者:  徐沛
Adobe PDF(10902Kb)  |  收藏  |  浏览/下载:109/8  |  提交时间:2023/06/16
深度强化学习  稀疏奖励  探索  
基于深度强化学习的群体协同策略方法研究 学位论文
, 2023
作者:  张天乐
Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:159/9  |  提交时间:2023/06/12
群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习  
对抗生成式模仿学习方法研究 学位论文
, 2023
作者:  关伟凡
Adobe PDF(7227Kb)  |  收藏  |  浏览/下载:97/5  |  提交时间:2023/06/29
强化学习  模仿学习  对抗生成训练  次优专家样本  基于观测的模仿学习  
执行者-评论家算法框架下的强化学习稳定性研究 学位论文
, 2023
作者:  龚晨
Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:96/6  |  提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击  
足球比赛态势智能分析与决策辅助方法研究 学位论文
, 2023
作者:  陈敏
Adobe PDF(8212Kb)  |  收藏  |  浏览/下载:85/3  |  提交时间:2023/06/27
足球  态势分析  深度学习  多智能体强化学习  迁移学习  
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:87/2  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏