CASIA OpenIR

浏览/检索结果: 共837条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Policy Iteration Algorithm for Constrained Cost Optimal Control of Discrete-Time Nonlinear System 会议论文
, Shenzhen, China, 2021.7.18-22
作者:  Li, Tao;  Wei, Qinglai;  Li, Hongyang;  Song, Ruizhuo
Adobe PDF(920Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/05/28
等周约束最优控制问题及其逆问题研究 学位论文
, 2024
作者:  李涛
Adobe PDF(2814Kb)  |  收藏  |  浏览/下载:10/1  |  提交时间:2024/05/28
最优控制  逆最优控制  等周约束  自适应动态规划  智能控制  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
Isoperimetric Constraint Inference for Discrete-Time Nonlinear Systems Based on Inverse Optimal Control 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2024, 页码: 1 - 13
作者:  Wei, Qinglai;  Li, Tao;  Zhang, Jie;  Li, Hongyang;  Wang, Xin;  Xiao, Jun
Adobe PDF(1700Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/28
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
面向可泛化、可解释强化学习的因果环境建模 学位论文
, 2024
作者:  余忠蔚
Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  因果推理  环境模型  
Cooperative Task Scheduling and Planning Considering Resource Conflicts and Precedence Constraints 期刊论文
International Journal of Precision Engineering and Manufacturing, 2023, 页码: 1503-1516
作者:  Li, Donghui;  Su, Hu;  Xu, Xinyi;  Wang, Qingbin;  Qin, Jie;  Zou, Wei
Adobe PDF(2513Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/28
融合多源传感器信息的机器人定位与建图方法研究 学位论文
, 2024
作者:  施鹏程
Adobe PDF(33494Kb)  |  收藏  |  浏览/下载:26/0  |  提交时间:2024/05/28
同时定位与建图  多传感器融合定位  状态估计  视觉-惯性里程计  激光雷达-惯性里程计  不确定性估计