CASIA OpenIR

浏览/检索结果: 共347条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
事件因果关系挖掘关键技术研究 学位论文
, 2024
作者:  何致涛
Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
事件因果关系识别  事件因果关系解释生成  预训练语言模型  多智能体  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
融合专家知识与强化学习的自动驾驶策略研究 学位论文
, 2024
作者:  王宇霄
Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28
自动驾驶,深度模仿学习,深度强化学习,图神经网络  
基于深度学习的视频片段拷贝检测技术研究 学位论文
, 2024
作者:  张驰
Adobe PDF(23128Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28
版权保护  视频片段拷贝检测  深度学习  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
面向表格数据的语义解析泛化技术研究 学位论文
, 2024
作者:  孙润鑫
Adobe PDF(2868Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
自然语言处理  语义解析  文本到SQL  泛化能力  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
作者:  余忠蔚
Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  因果推理  环境模型