CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:58/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
仿生推进水下作业机器人自主运动控制研究 学位论文
, 2023
作者:  吕家启
Adobe PDF(8590Kb)  |  收藏  |  浏览/下载:335/13  |  提交时间:2023/06/19
仿生推进  水下作业机器人  水下避障  抗扰趋近控制  姿态控制  自主作业  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:364/90  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能  
基于深度强化学习的群体协同决策关键问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  王彗木
Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:334/1  |  提交时间:2021/06/24
群体系统  协同决策  多智能体系统  深度强化学习  图卷积网络  注 意力机制  
仿生滑翔机器海豚的多模态运动控制研究 学位论文
, 北京: 中国科学院大学, 2021
作者:  王健
Adobe PDF(8779Kb)  |  收藏  |  浏览/下载:415/27  |  提交时间:2021/06/04
仿生滑翔机器海豚  多模态  深度控制  路径规划  路径跟踪  
基于混合更新Q值的深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李主南
Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:215/5  |  提交时间:2020/06/10
深度强化学习  Q 学习算法  过估计  欠估计  Actor-Critic  凸组合  混合更新