已选(0)清除
条数/页: 排序方式: |
| Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文 , 线上, 2020-4 作者: Zhao EM(赵恩民); Deng SH(邓诗弘); Zang YF(臧一凡); Kang YX(康永欣); Li K(李凯); Xing JL(兴军亮) Adobe PDF(1999Kb)  |  收藏  |  浏览/下载:75/26  |  提交时间:2023/06/29 |
| Motion optimization for a robotic fish based on adversarial structured control 会议论文 , Dali, China, 2019年12月6日-2019年12月8日 作者: Yan, Shuaizheng; Wang, Jian; Wu, Zhengxing; Yu, Junzhi; Tan, Min Adobe PDF(1051Kb)  |  收藏  |  浏览/下载:65/25  |  提交时间:2023/06/12 |
| Efficient cooperative structured control for a multi-joint biomimetic robotic fish 期刊论文 IEEE/ASME Transactions on Mechatronics, 2020, 卷号: 26, 期号: 5, 页码: 2506-2516 作者: Yan Shuaizheng; Wu Zhengxing; Wang Jian; Tan Min; Yu Junzhi Adobe PDF(2394Kb)  |  收藏  |  浏览/下载:80/27  |  提交时间:2023/05/31 |
| Multi-robot cooperative target encirclement through learning distributed transferable policy 会议论文 , Online, July 19-24 作者: Zhang Tianle; Liu Zhen; Wu Shiguang; Pu Zhiqiang; Yi Jianqiang Adobe PDF(949Kb)  |  收藏  |  浏览/下载:176/54  |  提交时间:2022/06/16 |
| Multi-Agent Cooperation and Competition with Two-Level Ggraph Attention Network 会议论文 , 线上, 2020-11 作者: Shiguang, Wu; Zhiqiang, Pu; Jianqiang, Yi; Huimu, Wang Adobe PDF(1185Kb)  |  收藏  |  浏览/下载:145/1  |  提交时间:2021/06/24 |
| STGA-LSTM: A Spatial-Temporal Graph Attentional LSTM Scheme for Multi-Agent Cooperation 会议论文 , 线上, 2020-11 作者: Huimu Wang; Zhen Liu; Zhiqiang Pu; Jianqiang Yi Adobe PDF(916Kb)  |  收藏  |  浏览/下载:92/0  |  提交时间:2021/06/24 |
| Multi-Agent Formation Control with Obstacles Avoidance under Restricted Communication through Graph Reinforcement Learning 会议论文 , 线上, 2020.06 作者: Huimu, Wang; Tenghai, Qiu; Zhen, Liu; Zhiqiang, Pu; Jianqiang, Yi Adobe PDF(1461Kb)  |  收藏  |  浏览/下载:183/37  |  提交时间:2021/06/24 |
| A Soft Graph Attention Reinforcement Learning for Multi-Agent Cooperation 会议论文 , 线上, 2020-8 作者: Huimu Wang; Zhiqiang Pu; Zhen Liu; Jianqiang Yi; Tenghai Qiu Adobe PDF(815Kb)  |  收藏  |  浏览/下载:217/45  |  提交时间:2021/06/24 |
| 服务机器人导航与抓取检测研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 于莹莹 Adobe PDF(22709Kb)  |  收藏  |  浏览/下载:282/22  |  提交时间:2020/09/11 服务机器人 路径态势感知 导航 同时检测分割 遮挡修复 抓取检测 |
| 基于混合更新Q值的深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:189/5  |  提交时间:2020/06/10 深度强化学习 Q 学习算法 过估计 欠估计 Actor-Critic 凸组合 混合更新 |