CASIA OpenIR

浏览/检索结果: 共34条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Filtered Observations for Model-Based Multi-agent Reinforcement Learning 会议论文
, Turin, Italy, 2023.9.18-2023.9.22
作者:  Meng Linghui;  Xiong Xuantang;  Zang Yifan;  Zhang Xi;  Li Guoqi;  Xing Dengpeng;  Xu Bo
Adobe PDF(841Kb)  |  收藏  |  浏览/下载:53/20  |  提交时间:2024/06/11
Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:  Qingxu, Fu;  Xiaolin Ai;  Jianqiang Yi;  Tenghai Qiu;  Wanmai Yuan;  Zhiqiang Pu
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:47/14  |  提交时间:2024/06/05
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:66/24  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
A Wire-driven Elastic Robotic Fish and its Design and CPG-Based Control 期刊论文
Journal of Intelligent & Robotic Systems, 2023, 卷号: 107, 期号: 1, 页码: 4
作者:  Xiaocun Liao;  Chao Zhou;  Jian Wang;  Junfeng Fan;  Zhuoliang Zhang
Adobe PDF(1749Kb)  |  收藏  |  浏览/下载:58/20  |  提交时间:2024/05/28
Robotic fish  Wire-driven mode  Elastic component  Kinematics model  Body wave  
未知非线性零和博弈最优跟踪的事件触发控制设计 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 91-101
作者:  王鼎;  胡凌治;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(1996Kb)  |  收藏  |  浏览/下载:60/19  |  提交时间:2024/05/09
自适应评判设计  事件触发控制  神经网络  最优跟踪控制  稳定性分析  零和博弈  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:54/17  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
不确定工业过程运行指标异步更新强化学习决策算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:  李金娜;  袁林;  丁进良
Adobe PDF(1941Kb)  |  收藏  |  浏览/下载:68/28  |  提交时间:2024/05/09
运行优化控制  强化学习  数据驱动控制  自适应动态规划  安全运行  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:33/12  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
面向飞行目标的多传感器协同探测资源调度方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255
作者:  汪梦倩;  梁皓星;  郭茂耘;  陈小龙;  武艺
Adobe PDF(5512Kb)  |  收藏  |  浏览/下载:64/19  |  提交时间:2024/05/09
多传感器协同  资源调度  马尔科夫决策过程  强化学习  
支持重规划的战时保障动态调度研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 7, 页码: 1519-1529
作者:  曾斌;  樊旭;  李厚朴
Adobe PDF(1581Kb)  |  收藏  |  浏览/下载:62/19  |  提交时间:2024/04/25
战时保障  重规划  马尔科夫决策过程  动态调度  强化学习