CASIA OpenIR

浏览/检索结果: 共13条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文
, 线上, 2020-4
作者:  Zhao EM(赵恩民);  Deng SH(邓诗弘);  Zang YF(臧一凡);  Kang YX(康永欣);  Li K(李凯);  Xing JL(兴军亮)
Adobe PDF(1999Kb)  |  收藏  |  浏览/下载:75/26  |  提交时间:2023/06/29
Motion optimization for a robotic fish based on adversarial structured control 会议论文
, Dali, China, 2019年12月6日-2019年12月8日
作者:  Yan, Shuaizheng;  Wang, Jian;  Wu, Zhengxing;  Yu, Junzhi;  Tan, Min
Adobe PDF(1051Kb)  |  收藏  |  浏览/下载:64/25  |  提交时间:2023/06/12
Efficient cooperative structured control for a multi-joint biomimetic robotic fish 期刊论文
IEEE/ASME Transactions on Mechatronics, 2020, 卷号: 26, 期号: 5, 页码: 2506-2516
作者:  Yan Shuaizheng;  Wu Zhengxing;  Wang Jian;  Tan Min;  Yu Junzhi
Adobe PDF(2394Kb)  |  收藏  |  浏览/下载:80/27  |  提交时间:2023/05/31
Multi-robot cooperative target encirclement through learning distributed transferable policy 会议论文
, Online, July 19-24
作者:  Zhang Tianle;  Liu Zhen;  Wu Shiguang;  Pu Zhiqiang;  Yi Jianqiang
Adobe PDF(949Kb)  |  收藏  |  浏览/下载:176/54  |  提交时间:2022/06/16
Multi-Agent Cooperation and Competition with Two-Level Ggraph Attention Network 会议论文
, 线上, 2020-11
作者:  Shiguang, Wu;  Zhiqiang, Pu;  Jianqiang, Yi;  Huimu, Wang
Adobe PDF(1185Kb)  |  收藏  |  浏览/下载:145/1  |  提交时间:2021/06/24
STGA-LSTM: A Spatial-Temporal Graph Attentional LSTM Scheme for Multi-Agent Cooperation 会议论文
, 线上, 2020-11
作者:  Huimu Wang;  Zhen Liu;  Zhiqiang Pu;  Jianqiang Yi
Adobe PDF(916Kb)  |  收藏  |  浏览/下载:92/0  |  提交时间:2021/06/24
Multi-Agent Formation Control with Obstacles Avoidance under Restricted Communication through Graph Reinforcement Learning 会议论文
, 线上, 2020.06
作者:  Huimu, Wang;  Tenghai, Qiu;  Zhen, Liu;  Zhiqiang, Pu;  Jianqiang, Yi
Adobe PDF(1461Kb)  |  收藏  |  浏览/下载:183/37  |  提交时间:2021/06/24
A Soft Graph Attention Reinforcement Learning for Multi-Agent Cooperation 会议论文
, 线上, 2020-8
作者:  Huimu Wang;  Zhiqiang Pu;  Zhen Liu;  Jianqiang Yi;  Tenghai Qiu
Adobe PDF(815Kb)  |  收藏  |  浏览/下载:217/45  |  提交时间:2021/06/24
服务机器人导航与抓取检测研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  于莹莹
Adobe PDF(22709Kb)  |  收藏  |  浏览/下载:282/22  |  提交时间:2020/09/11
服务机器人  路径态势感知  导航  同时检测分割  遮挡修复  抓取检测  
基于混合更新Q值的深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李主南
Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:189/5  |  提交时间:2020/06/10
深度强化学习  Q 学习算法  过估计  欠估计  Actor-Critic  凸组合  混合更新