已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:58/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 仿生推进水下作业机器人自主运动控制研究 学位论文 , 2023 作者: 吕家启 Adobe PDF(8590Kb)  |  收藏  |  浏览/下载:335/13  |  提交时间:2023/06/19 仿生推进 水下作业机器人 水下避障 抗扰趋近控制 姿态控制 自主作业 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强; 易建强; 刘振; 丘腾海; 孙金林; 李非墨 Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:364/90  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |
| 基于深度强化学习的群体协同决策关键问题研究 学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木 Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:334/1  |  提交时间:2021/06/24 群体系统 协同决策 多智能体系统 深度强化学习 图卷积网络 注 意力机制 |
| 仿生滑翔机器海豚的多模态运动控制研究 学位论文 , 北京: 中国科学院大学, 2021 作者: 王健 Adobe PDF(8779Kb)  |  收藏  |  浏览/下载:415/27  |  提交时间:2021/06/04 仿生滑翔机器海豚 多模态 深度控制 路径规划 路径跟踪 |
| 基于混合更新Q值的深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:215/5  |  提交时间:2020/06/10 深度强化学习 Q 学习算法 过估计 欠估计 Actor-Critic 凸组合 混合更新 |