CASIA OpenIR

浏览/检索结果: 共61条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:16/6  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
机器人运动轨迹的模仿学习综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 315-334
作者:  黄艳龙;  徐德;  谭民
Adobe PDF(4795Kb)  |  收藏  |  浏览/下载:21/6  |  提交时间:2024/05/20
机器人技能学习  模仿学习  运动基元  轨迹学习  
基于DDPG的三维重建模糊概率点推理 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 1105-1118
作者:  李雷;  徐浩;  吴素萍
Adobe PDF(6084Kb)  |  收藏  |  浏览/下载:16/6  |  提交时间:2024/05/20
三维重建  强化学习  深度学习  注意力机制  信息聚合  
数据驱动的保证收敛速率最优输出调节 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 980-991
作者:  姜艺;  范家璐;  柴天佑
Adobe PDF(1589Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/20
保证收敛速率  最优输出调节  强化学习  值迭代  
基于事件触发的离散MIMO系统自适应评判容错控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 5, 页码: 1234-1245
作者:  王敏;  黄龙旺;  杨辰光
Adobe PDF(3211Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/20
事件触发控制  自适应评判设计  神经网络  离散非线性系统  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
具有解耦性能的离散时间线性多变量系统最优跟踪控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1931-1939
作者:  富月;  陈威
Adobe PDF(1344Kb)  |  收藏  |  浏览/下载:17/6  |  提交时间:2024/05/20
解耦  跟踪控制  离散时间线性系统  多变量系统  
基于GPR和深度强化学习的分层人机协作控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2352-2360
作者:  金哲豪;  刘安东;  俞立
Adobe PDF(5643Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/20
深度强化学习  高斯过程回归  人体控制策略感知  分层人机协作  
基于强化学习的部分线性离散时间系统的最优输出调节 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2242-2253
作者:  庞文砚;  范家璐;  姜艺;  LEWISFrankLeroy
Adobe PDF(1892Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/05/20
输出调节  离散时间系统  强化学习  非线性未知动态  
面向离散地形的欠驱动双足机器人平衡控制方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2164-2174
作者:  韩连强;  陈学超;  余张国;  高志发;  黄岩;  黄强
Adobe PDF(2902Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/20
欠驱动双足机器人  离散地形  平衡控制  虚拟约束  模型预测控制