已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:37/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉![](/image/person.jpg)
Adobe PDF(6367Kb)  |   收藏  |  浏览/下载:63/6  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 多智能体博弈、学习与控制 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613 作者: 王龙; 黄锋
Adobe PDF(2088Kb)  |   收藏  |  浏览/下载:26/9  |  提交时间:2024/05/09 博弈论 多智能体学习 控制论 强化学习 人工智能 |
| 基于混合数据增强的MSWI过程燃烧状态识别 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 560-575 作者: 郭海涛; 汤健; 丁海旭; 乔俊飞
Adobe PDF(22340Kb)  |   收藏  |  浏览/下载:42/13  |  提交时间:2024/04/10 城市固废焚烧 深度卷积生成对抗网络 燃烧状态识别 非生成式数据增强 混合数据增强 |
| 复杂对抗条件下对手意图识别关键技术研究 学位论文 , 2023 作者: 徐佳乐![](/image/person.jpg)
Adobe PDF(3048Kb)  |   收藏  |  浏览/下载:225/10  |  提交时间:2023/06/28 不完美信息博弈 多智能体策略博弈 对手意图识别 知识与数据融合 事件图态势建模 |
| 执行者-评论家算法框架下的强化学习稳定性研究 学位论文 , 2023 作者: 龚晨![](/image/person.jpg)
Adobe PDF(8324Kb)  |   收藏  |  浏览/下载:110/6  |  提交时间:2023/06/26 深度强化学习,稳定性,共轭,对抗性攻击,后门攻击 |
| 基于表示学习和对手建模的动态博弈系统策略生成技术研究 学位论文 , 2023 作者: 詹员![](/image/person.jpg)
Adobe PDF(12738Kb)  |   收藏  |  浏览/下载:137/8  |  提交时间:2023/06/06 深度强化学习 表示学习 对手建模 空中博弈 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开![](/image/person.jpg)
Adobe PDF(17847Kb)  |   收藏  |  浏览/下载:244/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 博弈对抗环境中智能策略研究 学位论文 工学博士, 北京: 中国科学院自动化研究所, 2021 作者: 唐振韬![](/image/person.jpg)
Adobe PDF(23513Kb)  |   收藏  |  浏览/下载:654/17  |  提交时间:2021/07/14 深度强化学习 统计前向规划 策略博弈 智能决策 游戏人工智能 |
| 一种针对德州扑克AI的对手建模与策略集成框架 期刊论文 自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙 ; 李凯 ; 吴哲 ; 臧一凡; 徐航; 兴军亮![](/image/person.jpg)
Adobe PDF(1354Kb)  |   收藏  |  浏览/下载:428/120  |  提交时间:2021/06/21 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |