已选(0)清除
条数/页: 排序方式: |
| 多智能体博弈、学习与控制 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613 作者: 王龙; 黄锋 Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/05/09 博弈论 多智能体学习 控制论 强化学习 人工智能 |
| 安全强化学习综述 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/24 安全强化学习 约束马尔科夫决策过程 学习过程 学习目标 离线强化学习 |
| 基于优先采样模型的离线强化学习 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:52/13  |  提交时间:2024/04/12 离线强化学习 优先采样模型 时序差分误差 鞅 批约束深度Q学习 |
| 基于深度强化学习的超车换道决策方法 学位论文 , 2023 作者: 王俊杰 Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:153/3  |  提交时间:2023/06/26 深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化 |
| 基于深度强化学习的连续动作空中博弈对抗决策 学位论文 , 2023 作者: 李伟凡 Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:396/18  |  提交时间:2023/06/26 强化学习 深度强化学习 自注意力网络 智能决策 多智能体系统 |
| 执行者-评论家算法框架下的强化学习稳定性研究 学位论文 , 2023 作者: 龚晨 Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:96/6  |  提交时间:2023/06/26 深度强化学习,稳定性,共轭,对抗性攻击,后门攻击 |
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 , 2023 作者: 白云鹏 Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:153/9  |  提交时间:2023/06/13 多智能体,强化学习,超图,变分推断,好奇心 |
| 基于自适应动态规划的最优跟踪控制方法研究 学位论文 , 2023 作者: 王鑫 Adobe PDF(6647Kb)  |  收藏  |  浏览/下载:163/10  |  提交时间:2023/06/08 自适应动态规划 输出调节 追逃博弈 最优控制 一致性控制 |
| 平行交通系统中的预测与控制关键技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 戴星原 Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:282/12  |  提交时间:2022/10/09 平行交通系统 交通预测 交通控制 深度学习 强化学习 |
| 基于平行学习的混合智能调控方法与应用研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李小双 Adobe PDF(10128Kb)  |  收藏  |  浏览/下载:202/13  |  提交时间:2022/06/20 平行学习 混合智能调控 示教数据 模仿学习 深度强化学习 |