CASIA OpenIR

浏览/检索结果: 共39条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control 会议论文
Advances in Neural Information Processing Systems, New Orleans, USA, 2023-12-10
作者:  Chao Li;  Chen Gong;  Qiang He;  Xinwen Hou
Adobe PDF(1457Kb)  |  收藏  |  浏览/下载:16/4  |  提交时间:2024/05/30
Consensus Learning for Cooperative Multi-Agent Reinforcement Learning 会议论文
, Washington, DC, USA, February 7-14, 2023
作者:  Zhiwei Xu;  Bin Zhang;  Dapeng Li;  Zeren Zhang;  Guangchong Zhou;  Hao Chen;  Guoliang Fan
Adobe PDF(4141Kb)  |  收藏  |  浏览/下载:13/4  |  提交时间:2024/05/28
航天器威胁规避智能自主控制技术研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 229-245
作者:  袁利;  姜甜甜
Adobe PDF(2092Kb)  |  收藏  |  浏览/下载:21/6  |  提交时间:2024/05/09
轨道威胁感知  自主决策规划  “感知-决策-执行”一体化  航天器智能自主控制  
机器人感知与控制关键技术及其智能制造应用 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 494-513
作者:  王耀南;  江一鸣;  姜娇;  张辉;  谭浩然;  彭伟星;  吴昊天;  曾凯
Adobe PDF(40511Kb)  |  收藏  |  浏览/下载:28/11  |  提交时间:2024/05/09
机器人  智能制造  视觉感知  智能控制  系统应用  信息物理系统  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:28/11  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
融合注意力机制的增强受限玻尔兹曼机驱动的交互式分布估计算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 10, 页码: 2188-2200
作者:  暴琳;  孙晓燕;  巩敦卫;  张勇
Adobe PDF(4282Kb)  |  收藏  |  浏览/下载:30/8  |  提交时间:2024/04/24
用户生成内容  个性化进化搜索  交互式  分布估计算法  受限玻尔兹曼机  
Multistep Look-Ahead Policy Iteration for Optimal Control of Discrete-Time Nonlinear Systems With Isoperimetric Constraints 期刊论文
IEEE TRANSACTIONS ON SYSTEMS MAN CYBERNETICS-SYSTEMS, 2023, 卷号: 54, 期号: 3, 页码: 1414-1426
作者:  Li, Tao;  Wei, Qinglai;  Wang, Fei-Yue
Adobe PDF(784Kb)  |  收藏  |  浏览/下载:78/6  |  提交时间:2024/02/22
Performance analysis  Optimal control  Dynamic programming  Iterative algorithms  Upper bound  Measurement  Convergence  Adaptive dynamic programming (ADP)  isoperimetric constraints  nonlinear systems  optimal control  policy iteration  
Multi-task safe reinforcement learning for navigating intersections in dense traffic 期刊论文
JOURNAL OF THE FRANKLIN INSTITUTE-ENGINEERING AND APPLIED MATHEMATICS, 2023, 卷号: 360, 期号: 17, 页码: 13737-13760
作者:  Liu, Yuqi;  Gao, Yinfeng;  Zhang, Qichao;  Ding, Dawei;  Zhao, Dongbin
Adobe PDF(3095Kb)  |  收藏  |  浏览/下载:52/4  |  提交时间:2024/02/22
A Parallel Control Method For Zero-Sum Games With Unknown Time-varying System 期刊论文
The International Journal of Intelligent Control and Systems, 2023, 页码: 5页
作者:  Qinglai Wei;  Zhenhua Zhu;  Jie Zhang;  Feiyue Wang
Adobe PDF(470Kb)  |  收藏  |  浏览/下载:143/56  |  提交时间:2023/12/15
二人零和动态博弈的自学习平行控制方法研究 学位论文
, 2023
作者:  朱振华
Adobe PDF(1737Kb)  |  收藏  |  浏览/下载:157/6  |  提交时间:2023/12/15
自适应动态规划  平行控制  零和博弈