CASIA OpenIR

浏览/检索结果: 共3条,第1-3条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文
, 2024
作者:  王筱琦
Adobe PDF(2737Kb)  |  收藏  |  浏览/下载:38/1  |  提交时间:2024/06/06
兵棋推演  模仿学习  强化学习  人机对抗  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:58/5  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型