CASIA OpenIR

浏览/检索结果: 共116条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800
作者:  Jingqing Ruan;   Kaishen Wang;   Qingyang Zhang;   Dengpeng Xing;   Bo Xu
Adobe PDF(4577Kb)  |  收藏  |  浏览/下载:25/11  |  提交时间:2024/07/18
Reinforcement learning  representation learning  subtask planning  task decomposition  pretraining.  
A Novel Divide and Conquer Solution for Long-term Video Salient Object Detection 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 684-703
作者:  Yun-Xiao Li;  Cheng-Li-Zhao Chen;   Shuai Li;   Ai-Min Hao;  Hong Qin
Adobe PDF(6454Kb)  |  收藏  |  浏览/下载:28/10  |  提交时间:2024/07/18
Video salient object detection  background consistency analysis  weakly supervised learning  long-term information  background shift  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604
作者:  Kun Jiang;  Wenzhang Liu;  Yuanda Wang;  Lu Dong;  Changyin Sun
Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:50/19  |  提交时间:2024/06/07
Latent variable model  maximum entropy  multi-agent reinforcement learning (MARL)  multi-agent system  
时延非线性系统无模型预设性能控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 937-946
作者:  张晋熙;  柴天佑;  王良勇
Adobe PDF(2844Kb)  |  收藏  |  浏览/下载:59/25  |  提交时间:2024/05/30
无模型控制  预设性能  参考跟踪  时延系统  非线性系统  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:57/21  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
A Two-layer Encoding Learning Swarm Optimizer based on Frequent Itemsets for Sparse Large-scale Multi-objective Optimization 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1342-1357
作者:  Sheng Qi;  Rui Wang;  Tao Zhang;  Xu Yang;  Ruiqing Sun;  Ling Wang
Adobe PDF(3038Kb)  |  收藏  |  浏览/下载:73/23  |  提交时间:2024/05/22
Evolutionary algorithms  learning swarm optimization  sparse large-scale optimization  sparse large-scale multi-objective problems  two-layer encoding  
机器人运动轨迹的模仿学习综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 315-334
作者:  黄艳龙;  徐德;  谭民
Adobe PDF(4795Kb)  |  收藏  |  浏览/下载:74/27  |  提交时间:2024/05/20
机器人技能学习  模仿学习  运动基元  轨迹学习  
基于轮胎状态刚度预测的极限工况路径跟踪控制研究 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 6, 页码: 1590-1600
作者:  王国栋;  刘洋;  李绍松;  卢晓晖;  张邦成
Adobe PDF(2494Kb)  |  收藏  |  浏览/下载:52/20  |  提交时间:2024/05/20
自动驾驶车辆  路径跟踪  转向避撞  模型预测控制  状态刚度预测  
基于事件相机的机器人感知与控制综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1869-1889
作者:  粟傈;  杨帆;  王向禹;  郭川东;  童良乐;  胡权
Adobe PDF(47918Kb)  |  收藏  |  浏览/下载:43/12  |  提交时间:2024/05/20
事件相机  延迟低  机器人控制  感知与运动  新型控制算法