CASIA OpenIR

Browse/Search Results:  1-10 of 310 Help

Selected(0)Clear Items/Page:    Sort:
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
Authors:  李超
Adobe PDF(7255Kb)  |  Favorite  |  View/Download:7/0  |  Submit date:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
事件因果关系挖掘关键技术研究 学位论文
, 2024
Authors:  何致涛
Adobe PDF(3575Kb)  |  Favorite  |  View/Download:7/0  |  Submit date:2024/05/28
事件因果关系识别  事件因果关系解释生成  预训练语言模型  多智能体  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
Authors:  杨依明
Adobe PDF(19731Kb)  |  Favorite  |  View/Download:7/0  |  Submit date:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
Authors:  钮龙宇
Adobe PDF(9528Kb)  |  Favorite  |  View/Download:7/0  |  Submit date:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
BEVBert: Multimodal Map Pre-training for Language-guided Navigation 会议论文
Proceedings of the IEEE International Conference on Computer Vision, Paris, France, 2023-10-2
Authors:  Dong An;  Yuankai Qi;  Yangguang Li;  Yan Huang;  Liang Wang;  Tieniu Tan;  Jing Shao
Adobe PDF(1722Kb)  |  Favorite  |  View/Download:11/0  |  Submit date:2024/05/28
Isoperimetric Constraint Inference for Discrete-Time Nonlinear Systems Based on Inverse Optimal Control 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2024, 页码: 1 - 13
Authors:  Wei, Qinglai;  Li, Tao;  Zhang, Jie;  Li, Hongyang;  Wang, Xin;  Xiao, Jun
Adobe PDF(1700Kb)  |  Favorite  |  View/Download:0/0  |  Submit date:2024/05/28
Learning Causal Dynamics Models in Object-Oriented Environments 会议论文
Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21
Authors:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(2176Kb)  |  Favorite  |  View/Download:4/0  |  Submit date:2024/05/28
强化学习  因果模型  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
Authors:  徐志伟
Adobe PDF(12464Kb)  |  Favorite  |  View/Download:7/0  |  Submit date:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
Authors:  孟令辉
Adobe PDF(5071Kb)  |  Favorite  |  View/Download:10/2  |  Submit date:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
Authors:  余忠蔚
Adobe PDF(9111Kb)  |  Favorite  |  View/Download:8/0  |  Submit date:2024/05/28
强化学习  因果推理  环境模型