已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:57/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 仿生机器双髻鲨的水下环境感知与自主导航研究 学位论文 , 2023 作者: 闫帅铮 Adobe PDF(42821Kb)  |  收藏  |  浏览/下载:240/27  |  提交时间:2023/06/07 仿生机器双髻鲨 水下图像质量复原 深度强化学习 自主避障 视觉导航 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强; 易建强; 刘振; 丘腾海; 孙金林; 李非墨 Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:356/88  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |
| 基于深度强化学习的群体协同决策关键问题研究 学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木 Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:332/1  |  提交时间:2021/06/24 群体系统 协同决策 多智能体系统 深度强化学习 图卷积网络 注 意力机制 |
| 深度神经网络自动设计方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 王家兴 Adobe PDF(9209Kb)  |  收藏  |  浏览/下载:219/11  |  提交时间:2021/06/16 深度学习 网络结构搜索 模型压缩 贝叶斯方法 机器学习 |
| 基于混合更新Q值的深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:214/5  |  提交时间:2020/06/10 深度强化学习 Q 学习算法 过估计 欠估计 Actor-Critic 凸组合 混合更新 |