已选(0)清除
条数/页: 排序方式: |
| 面向飞行目标的多传感器协同探测资源调度方法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255 作者: 汪梦倩; 梁皓星; 郭茂耘; 陈小龙; 武艺 Adobe PDF(5512Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/09 多传感器协同 资源调度 马尔科夫决策过程 强化学习 |
| 异策略深度强化学习中的经验回放研究综述 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256 作者: 胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:21/7  |  提交时间:2024/04/18 深度强化学习 异策略 经验回放 人工智能 |
| Reinforcement Learning in Process Industries: Review and Perspective 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 2, 页码: 283-300 作者: Oguzhan Dogru; Junyao Xie; Om Prakash; Ranjith Chiplunkar; Jansen Soesanto; Hongtian Chen; Kirubakaran Velswamy; Fadi Ibrahim; Biao Huang Adobe PDF(1275Kb)  |  收藏  |  浏览/下载:38/13  |  提交时间:2024/01/23 Process control process systems engineering reinforcement learning |
| Recent Progress in Reinforcement Learning and Adaptive Dynamic Programming for Advanced Control Applications 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 1, 页码: 18-36 作者: Ding Wang; Ning Gao; Derong Liu; Jinna Li; Frank L. Lewis Adobe PDF(1945Kb)  |  收藏  |  浏览/下载:246/180  |  提交时间:2024/01/02 Adaptive dynamic programming (ADP) advanced control complex environment data-driven control event-triggered design intelligent control neural networks nonlinear systems optimal control reinforcement learning (RL) |
| 足球比赛态势智能分析与决策辅助方法研究 学位论文 , 2023 作者: 陈敏 Adobe PDF(8212Kb)  |  收藏  |  浏览/下载:88/3  |  提交时间:2023/06/27 足球 态势分析 深度学习 多智能体强化学习 迁移学习 |
| 基于深度强化学习的超车换道决策方法 学位论文 , 2023 作者: 王俊杰 Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:153/3  |  提交时间:2023/06/26 深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化 |
| 基于深度强化学习的连续动作空中博弈对抗决策 学位论文 , 2023 作者: 李伟凡 Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:389/18  |  提交时间:2023/06/26 强化学习 深度强化学习 自注意力网络 智能决策 多智能体系统 |
| 信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文 , 2023 作者: 赵恩民 Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:189/11  |  提交时间:2023/06/08 信息不完备 复杂决策问题 强化学习 单智能体探索 不完美信息博弈 |
| 面向兵棋推演的多智能体智能博弈决策算法研究 学位论文 , 2023 作者: 余照科 Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:711/34  |  提交时间:2023/01/31 请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词 |
| 基于多智能体强化学习的大规模路网交通信号控制 学位论文 学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈筱语 Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:184/12  |  提交时间:2022/06/16 交通信号控制 马尔科夫决策过程 多智能体强化学习 联邦强化学习 |