已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:26/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:504/86  |  提交时间:2022/07/12 |
| 一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文 自动化学报, 2022, 页码: 0 作者: 吴哲; 李凯; 徐航; 兴军亮 Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:230/64  |  提交时间:2022/06/17 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:203/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:244/49  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:322/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:239/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强; 易建强; 刘振; 丘腾海; 孙金林; 李非墨 Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:316/80  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |
| 高超声速飞行器不确定性抑制控制方法研究 学位论文 工学博士, 北京: 中国科学院大学, 2021 作者: 孙金林 Adobe PDF(18036Kb)  |  收藏  |  浏览/下载:279/1  |  提交时间:2021/06/28 高超声速飞行器 不确定性抑制 自适应模糊控制 抗干扰控制 有限时间控制 |
| 基于深度强化学习的群体协同决策关键问题研究 学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木 Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:300/1  |  提交时间:2021/06/24 群体系统 协同决策 多智能体系统 深度强化学习 图卷积网络 注 意力机制 |