CASIA OpenIR

浏览/检索结果: 共28条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
扩展目标跟踪中基于深度强化学习的传感器管理方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431
作者:  张虹芸;  陈辉;  张文旭
Adobe PDF(6523Kb)  |  收藏  |  浏览/下载:33/12  |  提交时间:2024/07/25
传感器管理  扩展目标跟踪  深度强化学习  双延迟深度确定性策略梯度  信息增益  
Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800
作者:  Jingqing Ruan;   Kaishen Wang;   Qingyang Zhang;   Dengpeng Xing;   Bo Xu
Adobe PDF(4577Kb)  |  收藏  |  浏览/下载:25/11  |  提交时间:2024/07/18
Reinforcement learning  representation learning  subtask planning  task decomposition  pretraining.  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
面向算力网络的智慧调度综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103
作者:  李逸博;  李小平;  王爽;  蒋嶷川
Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:27/19  |  提交时间:2024/07/02
算力网络  云计算  边缘计算  资源调度  知识  
A Multi-AGV Routing Planning Method Based on Deep Reinforcement Learning and Recurrent Neural Network 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1720-1722
作者:  Yishuai Lin;  Gang Hu;  Liang Wang;  Qingshan Li;  Jiawei Zhu
Adobe PDF(2948Kb)  |  收藏  |  浏览/下载:67/24  |  提交时间:2024/06/07
Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604
作者:  Kun Jiang;  Wenzhang Liu;  Yuanda Wang;  Lu Dong;  Changyin Sun
Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:50/19  |  提交时间:2024/06/07
Latent variable model  maximum entropy  multi-agent reinforcement learning (MARL)  multi-agent system  
Ultimately Bounded Output Feedback Control for Networked Nonlinear Systems With Unreliable Communication Channel: A Buffer-Aided Strategy 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1566-1578
作者:  Yuhan Zhang;  Zidong Wang;  Lei Zou;  Yun Chen;  Guoping Lu
Adobe PDF(2016Kb)  |  收藏  |  浏览/下载:45/14  |  提交时间:2024/06/07
Buffer-aided strategy  neural networks  nonlinear control  output-feedback control  unreliable communication channel  
融合自适应评判的随机系统数据驱动策略优化 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990
作者:  王鼎;  王将宇;  乔俊飞
Adobe PDF(2044Kb)  |  收藏  |  浏览/下载:66/27  |  提交时间:2024/05/30
自适应评判设计  数据驱动  离散系统  神经网络  Q-learning  随机最优控制  
Optimal Strategy for Aircraft Pursuit-evasion Games via Self-play Iteration 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 585-596
作者:  Xin Wang;  Qing-Lai Wei;  Tao Li;  Jie Zhang
Adobe PDF(1750Kb)  |  收藏  |  浏览/下载:73/25  |  提交时间:2024/05/23
Differential games, pursuit-evasion games, nonlinear control, optimal control, Nash equilibrium solution  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:65/19  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory