Knowledge Commons of Institute of Automation,CAS
基于GPR和深度强化学习的分层人机协作控制 | |
金哲豪; 刘安东; 俞立 | |
发表期刊 | 自动化学报 |
ISSN | 0254-4156 |
2022 | |
卷号 | 48期号:9页码:2352-2360 |
摘要 | 提出了一种基于高斯过程回归与深度强化学习的分层人机协作控制方法,并以人机协作控制球杆系统为例检验该方法的高效性.主要贡献是:1)在模型未知的情况下,采用深度强化学习算法设计了一种有效的非线性次优控制策略,并将其作为顶层期望控制策略以引导分层人机协作控制过程,解决了传统控制方法无法直接应用于模型未知人机协作场景的问题; 2)针对分层人机协作过程中人未知和随机控制策略带来的不利影响,采用高斯过程回归拟合人体控制策略以建立机器人对人控制行为的认知模型,在减弱该不利影响的同时提升机器人在协作过程中的主动性,从而进一步提升协作效率; 3)利用所得认知模型和期望控制策略设计机器人末端速度的控制律,并通过实验对比验证了所提方法的有效性. |
关键词 | 深度强化学习 高斯过程回归 人体控制策略感知 分层人机协作 |
DOI | 10.16383/j.aas.c190451 |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/56293 |
专题 | 学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 金哲豪,刘安东,俞立. 基于GPR和深度强化学习的分层人机协作控制[J]. 自动化学报,2022,48(9):2352-2360. |
APA | 金哲豪,刘安东,&俞立.(2022).基于GPR和深度强化学习的分层人机协作控制.自动化学报,48(9),2352-2360. |
MLA | 金哲豪,et al."基于GPR和深度强化学习的分层人机协作控制".自动化学报 48.9(2022):2352-2360. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
AAS-CN-2019-0451.pdf(5643KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[金哲豪]的文章 |
[刘安东]的文章 |
[俞立]的文章 |
百度学术 |
百度学术中相似的文章 |
[金哲豪]的文章 |
[刘安东]的文章 |
[俞立]的文章 |
必应学术 |
必应学术中相似的文章 |
[金哲豪]的文章 |
[刘安东]的文章 |
[俞立]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论