CASIA OpenIR

浏览/检索结果: 共291条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
基于参数化网格约束的三维人体和手物交互重建 学位论文
, 2024
作者:  胡俊星
Adobe PDF(28026Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/29
单目图像  参数化网格约束  人体网格重建  手物接触估计  手物交互重建  
灵巧手机器人的类人物体交接学习研究 学位论文
, 2024
作者:  段昊男
Adobe PDF(51787Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/29
机器人学习  人机交互  物体交接  灵巧手机器人  
Policy Iteration Algorithm for Constrained Cost Optimal Control of Discrete-Time Nonlinear System 会议论文
, Shenzhen, China, 2021.7.18-22
作者:  Li, Tao;  Wei, Qinglai;  Li, Hongyang;  Song, Ruizhuo
Adobe PDF(920Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/05/28
Explainable Reinforcement Learning via a Causal World Model 会议论文
Proceedings of the 32nd International Joint Conference on Artificial Intelligence, 中国澳门, 2023-08-22
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(850Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/28
强化学习  可解释人工智能  因果推理  
Learning Causal Dynamics Models in Object-Oriented Environments 会议论文
Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
强化学习  因果模型  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:12/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:15/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
作者:  余忠蔚
Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/28
强化学习  因果推理  环境模型  
Dual Self-Awareness Value Decomposition Framework without Individual Global Max for Cooperative MARL 会议论文
, New Orleans, LA, USA, December 10-16, 2023
作者:  Zhiwei Xu;  Bin Zhang;  Dapeng Li;  Guangchong Zhou;  Zeren Zhang;  Guoliang Fan
Adobe PDF(8700Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/28