CASIA OpenIR

浏览/检索结果: 共300条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Overhead-free Noise-tolerant Federated Learning: A New Baseline 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 526-537
作者:  Shiyi Lin;  Deming Zhai;  Feilong Zhang;  Junjun Jiang;  Xianming Liu;  Xiangyang Ji
Adobe PDF(1816Kb)  |  收藏  |  浏览/下载:5/4  |  提交时间:2024/05/23
Federated learning, noise-label learning, privacy-preserving machine learning, edge intelligence, distributed machine learning  
Collective Movement Simulation: Methods and Applications 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 452-480
作者:  Hua Wang;  Xing-Yu Guo;  Hao Tao;  Ming-Liang Xu
Adobe PDF(1439Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/05/23
Collective movement simulation, multiple objects, multiple discipline, simulation effect, collective intelligence  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
基于折扣广义值迭代的智能最优跟踪及应用验证 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 182-193
作者:  王鼎;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(2055Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/20
自适应评判控制  可容许性  广义值迭代  智能最优跟踪  神经网络  
迭代学习模型预测控制研究现状与挑战 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 6, 页码: 1385-1401
作者:  马乐乐;  刘向杰;  高福荣
Adobe PDF(1566Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/20
迭代学习模型预测控制  二维预测模型  控制律迭代优化  复杂非线性系统  快速系统  变工况  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
机器人感知与控制关键技术及其智能制造应用 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 494-513
作者:  王耀南;  江一鸣;  姜娇;  张辉;  谭浩然;  彭伟星;  吴昊天;  曾凯
Adobe PDF(40511Kb)  |  收藏  |  浏览/下载:13/7  |  提交时间:2024/05/09
机器人  智能制造  视觉感知  智能控制  系统应用  信息物理系统  
Enhancing Multi-agent Coordination via Dual-channel Consensus 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 349-368
作者:  Qingyang Zhang;  Kaishen Wang;  Jingqing Ruan;  Yiming Yang;  Dengpeng Xing;  Bo Xu
Adobe PDF(4997Kb)  |  收藏  |  浏览/下载:16/7  |  提交时间:2024/04/23
Multi-agent reinforcement learning, contrastive representation learning, consensus, multi-agent cooperation, cognitive consistency