已选(0)清除
条数/页: 排序方式: |
| 基于视觉表征的深度强化学习方法 学位论文 , 2024 作者: 刘民颂![](/image/person.jpg)
Adobe PDF(10778Kb)  |   收藏  |  浏览/下载:15/1  |  提交时间:2024/06/22 深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络 |
| 基于脑脉冲序列的离散时间动态系统学习控制研究 学位论文 , 2024 作者: 韩立元![](/image/person.jpg)
Adobe PDF(32282Kb)  |   收藏  |  浏览/下载:25/4  |  提交时间:2024/06/04 离散时间动态系统 脑脉冲序列 脉冲自适应动态规划 脉冲神经网络 多尺度动力学 脑机接口 |
| 基于序列展开模型的多智能体方法研究 学位论文 , 2024 作者: Luo ZX(罗正昕)![](/image/person.jpg)
Adobe PDF(13451Kb)  |   收藏  |  浏览/下载:41/1  |  提交时间:2024/05/30 多智能体 强化学习 序列展开模型 信度分配 非平稳性 |
| 融合自适应评判的随机系统数据驱动策略优化 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990 作者: 王鼎 ; 王将宇; 乔俊飞
Adobe PDF(2044Kb)  |   收藏  |  浏览/下载:34/16  |  提交时间:2024/05/30 自适应评判设计 数据驱动 离散系统 神经网络 Q-learning 随机最优控制 |
| 等周约束最优控制问题及其逆问题研究 学位论文 , 2024 作者: 李涛![](/image/person.jpg)
Adobe PDF(2814Kb)  |   收藏  |  浏览/下载:27/3  |  提交时间:2024/05/28 最优控制 逆最优控制 等周约束 自适应动态规划 智能控制 |
| 面向平行交通系统的城市交通控制基础模型关键技术 学位论文 , 2024 作者: 赵宸![](/image/person.jpg)
Adobe PDF(6234Kb)  |   收藏  |  浏览/下载:39/5  |  提交时间:2024/05/27 平行交通系统 交通控制 平行学习 强化学习 基础模型 |
| 基于强化学习的部分线性离散时间系统的最优输出调节 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2242-2253 作者: 庞文砚; 范家璐; 姜艺; LEWISFrankLeroy
Adobe PDF(1892Kb)  |   收藏  |  浏览/下载:11/5  |  提交时间:2024/05/20 输出调节 离散时间系统 强化学习 非线性未知动态 |
| 复杂工业过程非串级双速率组合分散运行优化控制 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 172-184 作者: 赵建国; 杨春雨
Adobe PDF(1648Kb)  |   收藏  |  浏览/下载:58/17  |  提交时间:2024/05/09 复杂工业过程 运行优化控制 奇异摄动理论 Q-学习 双速率 |
| 不确定工业过程运行指标异步更新强化学习决策算法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472 作者: 李金娜; 袁林; 丁进良
Adobe PDF(1941Kb)  |   收藏  |  浏览/下载:46/17  |  提交时间:2024/05/09 运行优化控制 强化学习 数据驱动控制 自适应动态规划 安全运行 |
| 基于终端诱导强化学习的航天器轨道追逃博弈 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984 作者: 耿远卓; 袁利; 黄煌; 汤亮
Adobe PDF(3292Kb)  |   收藏  |  浏览/下载:9/6  |  提交时间:2024/05/09 航天器追逃 智能博弈 近端策略优化 奖励函数设计 终端诱导 |