CASIA OpenIR

浏览/检索结果: 共78条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
事件因果关系挖掘关键技术研究 学位论文
, 2024
作者:  何致涛
Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28
事件因果关系识别  事件因果关系解释生成  预训练语言模型  多智能体  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
, 中国重庆, 2024-5-7
作者:  Niu LY(钮龙宇);  Wan J(万军)
Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/28
融合专家知识与强化学习的自动驾驶策略研究 学位论文
, 2024
作者:  王宇霄
Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28
自动驾驶,深度模仿学习,深度强化学习,图神经网络  
基于深度学习的视频片段拷贝检测技术研究 学位论文
, 2024
作者:  张驰
Adobe PDF(23128Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/05/28
版权保护  视频片段拷贝检测  深度学习  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
面向表格数据的语义解析泛化技术研究 学位论文
, 2024
作者:  孙润鑫
Adobe PDF(2868Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
自然语言处理  语义解析  文本到SQL  泛化能力  
Learning Causal Dynamics Models in Object-Oriented Environments 会议论文
Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
强化学习  因果模型  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习