CASIA OpenIR

浏览/检索结果: 共12条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
医疗领域任务型对话系统研究 学位论文
, 2024
作者:  胡泽发
Adobe PDF(3935Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/29
医疗对话系统  任务型对话系统  对话理解  对话推理  幻觉现象  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
融合专家知识与强化学习的自动驾驶策略研究 学位论文
, 2024
作者:  王宇霄
Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/05/28
自动驾驶,深度模仿学习,深度强化学习,图神经网络  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:15/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
多智能体策略一致性奖励塑造算法研究 学位论文
, 2024
作者:  杨晨
Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/27
多智能体系统  深度强化学习  信用分配  奖励塑造  
分层强化学习的子目标生成与探索策略 学位论文
, 2024
作者:  王开申
Adobe PDF(8335Kb)  |  收藏  |  浏览/下载:19/0  |  提交时间:2024/05/27
分层强化学习,子目标生成,互信息,扩散模型