CASIA OpenIR

浏览/检索结果: 共46条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向飞行目标的多传感器协同探测资源调度方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255
作者:  汪梦倩;  梁皓星;  郭茂耘;  陈小龙;  武艺
Adobe PDF(5512Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/09
多传感器协同  资源调度  马尔科夫决策过程  强化学习  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:21/7  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
Reinforcement Learning in Process Industries: Review and Perspective 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 2, 页码: 283-300
作者:  Oguzhan Dogru;  Junyao Xie;  Om Prakash;  Ranjith Chiplunkar;  Jansen Soesanto;  Hongtian Chen;  Kirubakaran Velswamy;  Fadi Ibrahim;  Biao Huang
Adobe PDF(1275Kb)  |  收藏  |  浏览/下载:38/13  |  提交时间:2024/01/23
Process control  process systems engineering  reinforcement learning  
Recent Progress in Reinforcement Learning and Adaptive Dynamic Programming for Advanced Control Applications 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 1, 页码: 18-36
作者:  Ding Wang;  Ning Gao;  Derong Liu;  Jinna Li;  Frank L. Lewis
Adobe PDF(1945Kb)  |  收藏  |  浏览/下载:246/180  |  提交时间:2024/01/02
Adaptive dynamic programming (ADP)  advanced control  complex environment  data-driven control  event-triggered design  intelligent control  neural networks  nonlinear systems  optimal control  reinforcement learning (RL)  
足球比赛态势智能分析与决策辅助方法研究 学位论文
, 2023
作者:  陈敏
Adobe PDF(8212Kb)  |  收藏  |  浏览/下载:88/3  |  提交时间:2023/06/27
足球  态势分析  深度学习  多智能体强化学习  迁移学习  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:153/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:389/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文
, 2023
作者:  赵恩民
Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:189/11  |  提交时间:2023/06/08
信息不完备  复杂决策问题  强化学习  单智能体探索  不完美信息博弈  
面向兵棋推演的多智能体智能博弈决策算法研究 学位论文
, 2023
作者:  余照科
Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:711/34  |  提交时间:2023/01/31
请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈筱语
Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:184/12  |  提交时间:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习