CASIA OpenIR

浏览/检索结果: 共250条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
基于折扣广义值迭代的智能最优跟踪及应用验证 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 182-193
作者:  王鼎;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(2055Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
自适应评判控制  可容许性  广义值迭代  智能最优跟踪  神经网络  
迭代学习模型预测控制研究现状与挑战 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 6, 页码: 1385-1401
作者:  马乐乐;  刘向杰;  高福荣
Adobe PDF(1566Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/20
迭代学习模型预测控制  二维预测模型  控制律迭代优化  复杂非线性系统  快速系统  变工况  
基于强化学习的部分线性离散时间系统的最优输出调节 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2242-2253
作者:  庞文砚;  范家璐;  姜艺;  LEWISFrankLeroy
Adobe PDF(1892Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/20
输出调节  离散时间系统  强化学习  非线性未知动态  
未知非线性零和博弈最优跟踪的事件触发控制设计 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 91-101
作者:  王鼎;  胡凌治;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(1996Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/05/09
自适应评判设计  事件触发控制  神经网络  最优跟踪控制  稳定性分析  零和博弈  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
不确定工业过程运行指标异步更新强化学习决策算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:  李金娜;  袁林;  丁进良
Adobe PDF(1941Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/09
运行优化控制  强化学习  数据驱动控制  自适应动态规划  安全运行  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
面向飞行目标的多传感器协同探测资源调度方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255
作者:  汪梦倩;  梁皓星;  郭茂耘;  陈小龙;  武艺
Adobe PDF(5512Kb)  |  收藏  |  浏览/下载:6/1  |  提交时间:2024/05/09
多传感器协同  资源调度  马尔科夫决策过程  强化学习