已选(0)清除
条数/页: 排序方式: |
| Policy Iteration Algorithm for Constrained Cost Optimal Control of Discrete-Time Nonlinear System 会议论文 , Shenzhen, China, 2021.7.18-22 作者: Li, Tao; Wei, Qinglai; Li, Hongyang; Song, Ruizhuo Adobe PDF(920Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/05/28 |
| 等周约束最优控制问题及其逆问题研究 学位论文 , 2024 作者: 李涛 Adobe PDF(2814Kb)  |  收藏  |  浏览/下载:10/1  |  提交时间:2024/05/28 最优控制 逆最优控制 等周约束 自适应动态规划 智能控制 |
| 面向高仿真场景的深度强化学习算法研究 学位论文 , 2024 作者: 钮龙宇 Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 深度强化学习 高仿真场景 分层学习 模仿学习 表征学习 |
| Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264 作者: Wei, Qinglai; Li, Tao Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/28 Adaptive dynamic programming approximate dynamic programming constrained cost optimal control reinforcement learning |
| Isoperimetric Constraint Inference for Discrete-Time Nonlinear Systems Based on Inverse Optimal Control 期刊论文 IEEE TRANSACTIONS ON CYBERNETICS, 2024, 页码: 1 - 13 作者: Wei, Qinglai; Li, Tao; Zhang, Jie; Li, Hongyang; Wang, Xin; Xiao, Jun Adobe PDF(1700Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/28 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 面向可泛化、可解释强化学习的因果环境建模 学位论文 , 2024 作者: 余忠蔚 Adobe PDF(9111Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 强化学习 因果推理 环境模型 |
| Cooperative Task Scheduling and Planning Considering Resource Conflicts and Precedence Constraints 期刊论文 International Journal of Precision Engineering and Manufacturing, 2023, 页码: 1503-1516 作者: Li, Donghui; Su, Hu; Xu, Xinyi; Wang, Qingbin; Qin, Jie; Zou, Wei Adobe PDF(2513Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/28 |
| 融合多源传感器信息的机器人定位与建图方法研究 学位论文 , 2024 作者: 施鹏程 Adobe PDF(33494Kb)  |  收藏  |  浏览/下载:26/0  |  提交时间:2024/05/28 同时定位与建图 多传感器融合定位 状态估计 视觉-惯性里程计 激光雷达-惯性里程计 不确定性估计 |