CASIA OpenIR

浏览/检索结果: 共22条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
Fixed-Time Gradient Flows for Solving Constrained Optimization: A Unified Approach 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 8, 页码: 1849-1864
作者:  Xinli Shi;  Xiangping Xu;  Guanghui Wen;  Jinde Cao
Adobe PDF(2318Kb)  |  收藏  |  浏览/下载:9/3  |  提交时间:2024/07/16
Consensus  constrained optimization  disturbance rejection  linear equations  fixed-time gradient flow (FxTGF)  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:12/8  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
面向算力网络的智慧调度综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103
作者:  李逸博;  李小平;  王爽;  蒋嶷川
Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:11/7  |  提交时间:2024/07/02
算力网络  云计算  边缘计算  资源调度  知识  
Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604
作者:  Kun Jiang;  Wenzhang Liu;  Yuanda Wang;  Lu Dong;  Changyin Sun
Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:39/14  |  提交时间:2024/06/07
Latent variable model  maximum entropy  multi-agent reinforcement learning (MARL)  multi-agent system  
机器人化复合材料自动铺层技术综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 873-897
作者:  郭鹏;  杨辰光;  李祥利;  章艺;  李淼
Adobe PDF(14269Kb)  |  收藏  |  浏览/下载:41/17  |  提交时间:2024/05/30
碳纤维增强复合材料  机械臂控制  末端设计  自动铺层  
Collective Movement Simulation: Methods and Applications 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 452-480
作者:  Hua Wang;  Xing-Yu Guo;  Hao Tao;  Ming-Liang Xu
Adobe PDF(1439Kb)  |  收藏  |  浏览/下载:46/13  |  提交时间:2024/05/23
Collective movement simulation, multiple objects, multiple discipline, simulation effect, collective intelligence  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:45/17  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
Prescribed-Time Nash Equilibrium Seeking for Pursuit-Evasion Game 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1518-1520
作者:  Lei Xue;  Jianfeng Ye;  Yongbao Wu;  Jian Liu;  D. C. Wunsch
Adobe PDF(930Kb)  |  收藏  |  浏览/下载:53/22  |  提交时间:2024/05/22
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:107/26  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41
作者:  张振国;  毛建旭;  谭浩然;  王耀南;  张雪波;  江一鸣
Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:60/13  |  提交时间:2024/04/12
重大装备制造  多机器人  任务分配  运动规划