CASIA OpenIR

浏览/检索结果: 共136条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
迭代学习模型预测控制研究现状与挑战 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 6, 页码: 1385-1401
作者:  马乐乐;  刘向杰;  高福荣
Adobe PDF(1566Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/20
迭代学习模型预测控制  二维预测模型  控制律迭代优化  复杂非线性系统  快速系统  变工况  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
不确定工业过程运行指标异步更新强化学习决策算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:  李金娜;  袁林;  丁进良
Adobe PDF(1941Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/09
运行优化控制  强化学习  数据驱动控制  自适应动态规划  安全运行  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
面向飞行目标的多传感器协同探测资源调度方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255
作者:  汪梦倩;  梁皓星;  郭茂耘;  陈小龙;  武艺
Adobe PDF(5512Kb)  |  收藏  |  浏览/下载:8/1  |  提交时间:2024/05/09
多传感器协同  资源调度  马尔科夫决策过程  强化学习  
Comprehensive Relation Modelling for Image Paragraph Generation 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 369-382
作者:  Xianglu Zhu;  Zhang Zhang;  Wei Wang;  Zilei Wang
Adobe PDF(1963Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/04/23
Image paragraph generation, visual relationship, scene graph, graph convolutional network (GCN), long short-term memory  
Enhancing Multi-agent Coordination via Dual-channel Consensus 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 349-368
作者:  Qingyang Zhang;  Kaishen Wang;  Jingqing Ruan;  Yiming Yang;  Dengpeng Xing;  Bo Xu
Adobe PDF(4997Kb)  |  收藏  |  浏览/下载:16/7  |  提交时间:2024/04/23
Multi-agent reinforcement learning, contrastive representation learning, consensus, multi-agent cooperation, cognitive consistency  
AI in Human-computer Gaming: Techniques, Challenges and Opportunities 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 299-317
作者:  Qi-Yue Yin;  Jun Yang;  Kai-Qi Huang;  Mei-Jing Zhao;  Wan-Cheng Ni;  Bin Liang;  Yan Huang;  Shu Wu;  Liang Wang
Adobe PDF(2608Kb)  |  收藏  |  浏览/下载:17/4  |  提交时间:2024/04/23
Human-computer gaming, AI, intelligent decision making, deep reinforcement learning, self-play