CASIA OpenIR

浏览/检索结果: 共35条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
基于目标条件强化学习的无监督技能发现方法研究 学位论文
, 2024
作者:  张天
Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30
目标  稀疏奖励  无监督强化学习  探索  技能策略  
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
作者:  余忠蔚
Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28
强化学习  因果推理  环境模型  
多智能体策略一致性奖励塑造算法研究 学位论文
, 2024
作者:  杨晨
Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/27
多智能体系统  深度强化学习  信用分配  奖励塑造  
复杂对抗条件下对手意图识别关键技术研究 学位论文
, 2023
作者:  徐佳乐
Adobe PDF(3048Kb)  |  收藏  |  浏览/下载:179/10  |  提交时间:2023/06/28
不完美信息博弈  多智能体策略博弈  对手意图识别  知识与数据融合  事件图态势建模  
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:103/3  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏  
足球比赛态势智能分析与决策辅助方法研究 学位论文
, 2023
作者:  陈敏
Adobe PDF(8212Kb)  |  收藏  |  浏览/下载:91/3  |  提交时间:2023/06/27
足球  态势分析  深度学习  多智能体强化学习  迁移学习  
融合信息素机制的大规模多智能体协同技术 学位论文
, 2023
作者:  JiaHui Zhang
Adobe PDF(5936Kb)  |  收藏  |  浏览/下载:171/3  |  提交时间:2023/06/26
大规模多智能体协同  多智能体强化学习  信息素机制  知识蒸馏