CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:57/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
仿生机器双髻鲨的水下环境感知与自主导航研究 学位论文
, 2023
作者:  闫帅铮
Adobe PDF(42821Kb)  |  收藏  |  浏览/下载:240/27  |  提交时间:2023/06/07
仿生机器双髻鲨  水下图像质量复原  深度强化学习  自主避障  视觉导航  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:356/88  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能  
基于深度强化学习的群体协同决策关键问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  王彗木
Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:332/1  |  提交时间:2021/06/24
群体系统  协同决策  多智能体系统  深度强化学习  图卷积网络  注 意力机制  
深度神经网络自动设计方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  王家兴
Adobe PDF(9209Kb)  |  收藏  |  浏览/下载:219/11  |  提交时间:2021/06/16
深度学习  网络结构搜索  模型压缩  贝叶斯方法  机器学习  
基于混合更新Q值的深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李主南
Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:214/5  |  提交时间:2020/06/10
深度强化学习  Q 学习算法  过估计  欠估计  Actor-Critic  凸组合  混合更新