CASIA OpenIR

浏览/检索结果: 共102条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
基于目标条件强化学习的无监督技能发现方法研究 学位论文
, 2024
作者:  张天
Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:13/0  |  提交时间:2024/05/30
目标  稀疏奖励  无监督强化学习  探索  技能策略  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:12/1  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
基于机理建模和数据驱动的机器人装配技能学习研究 学位论文
, 2024
作者:  严少华
Adobe PDF(6690Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/29
位姿测量  对准控制  强化学习  装入控制  装配技能学习  
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:17/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
作者:  余忠蔚
Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28
强化学习  因果推理  环境模型