CASIA OpenIR

浏览/检索结果: 共142条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
事件因果关系挖掘关键技术研究 学位论文
, 2024
作者:  何致涛
Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
事件因果关系识别  事件因果关系解释生成  预训练语言模型  多智能体  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
融合专家知识与强化学习的自动驾驶策略研究 学位论文
, 2024
作者:  王宇霄
Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28
自动驾驶,深度模仿学习,深度强化学习,图神经网络  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:8/1  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
作者:  余忠蔚
Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  因果推理  环境模型  
管道式任务型对话系统关键技术研究 学位论文
, 2024
作者:  邱俊彦
Adobe PDF(5583Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/27
任务型对话系统  对话状态跟踪  对话策略  自然语言生成  
多智能体策略一致性奖励塑造算法研究 学位论文
, 2024
作者:  杨晨
Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/27
多智能体系统  深度强化学习  信用分配  奖励塑造