CASIA OpenIR

浏览/检索结果: 共115条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于深度强化学习的足球智能体球员策略方法研究 学位论文
, 2024
作者:  刘博寅
Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:35/0  |  提交时间:2024/07/12
足球  多智能体系统  深度强化学习  互信息  内在激励  预训练  
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:37/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:37/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:67/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
基于视觉表征的深度强化学习方法 学位论文
, 2024
作者:  刘民颂
Adobe PDF(10778Kb)  |  收藏  |  浏览/下载:42/4  |  提交时间:2024/06/22
深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络  
面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文
, 2024
作者:  徐一凡
Adobe PDF(20521Kb)  |  收藏  |  浏览/下载:35/3  |  提交时间:2024/06/20
多目标覆盖任务  强化学习  迁移泛化  课程学习  域自适应  环境偏移  
基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文
, 2024
作者:  王筱琦
Adobe PDF(2737Kb)  |  收藏  |  浏览/下载:53/1  |  提交时间:2024/06/06
兵棋推演  模仿学习  强化学习  人机对抗  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:83/7  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
类脑脉冲神经网络模型优化方法研究 学位论文
, 2024
作者:  李杨
Adobe PDF(7989Kb)  |  收藏  |  浏览/下载:38/2  |  提交时间:2024/06/04
脉冲神经网络优化  人工神经网络-脉冲神经网络转换  时空反向传播  时序高效知识蒸馏  高性能低延迟  
基于内在动机的深度强化学习探索策略研究 学位论文
, 2024
作者:  陈忠鹏
Adobe PDF(5803Kb)  |  收藏  |  浏览/下载:29/1  |  提交时间:2024/06/04
深度强化学习,内在动机,探索策略,稀疏奖励