已选(0)清除
条数/页: 排序方式: |
| 博弈对抗环境中智能策略研究 学位论文 工学博士, 北京: 中国科学院自动化研究所, 2021 作者: 唐振韬![](/image/person.jpg)
Adobe PDF(23513Kb)  |   收藏  |  浏览/下载:641/17  |  提交时间:2021/07/14 深度强化学习 统计前向规划 策略博弈 智能决策 游戏人工智能 |
| 基于多智能体强化学习的城市道路交通信号控制 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 刘皓![](/image/person.jpg)
Adobe PDF(4749Kb)  |   收藏  |  浏览/下载:228/4  |  提交时间:2021/07/02 交通信号控制 强化学习 多智能体 车联网 |
| 高超声速飞行器不确定性抑制控制方法研究 学位论文 工学博士, 北京: 中国科学院大学, 2021 作者: 孙金林![](/image/person.jpg)
Adobe PDF(18036Kb)  |   收藏  |  浏览/下载:279/1  |  提交时间:2021/06/28 高超声速飞行器 不确定性抑制 自适应模糊控制 抗干扰控制 有限时间控制 |
| 基于深度强化学习的群体协同决策关键问题研究 学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木![](/image/person.jpg)
Adobe PDF(8945Kb)  |   收藏  |  浏览/下载:300/1  |  提交时间:2021/06/24 群体系统 协同决策 多智能体系统 深度强化学习 图卷积网络 注 意力机制 |
| 一种针对德州扑克AI的对手建模与策略集成框架 期刊论文 自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙 ; 李凯 ; 吴哲 ; 臧一凡; 徐航; 兴军亮![](/image/person.jpg)
Adobe PDF(1354Kb)  |   收藏  |  浏览/下载:409/115  |  提交时间:2021/06/21 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| 多智能体博弈对抗的协同行为自学习算法与应用 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 董宗宽![](/image/person.jpg)
Adobe PDF(4970Kb)  |   收藏  |  浏览/下载:320/14  |  提交时间:2021/06/20 多智能体深度强化学习 协同行为学习 语言几何学 可解释性 Z学习 |
| 基于演化学习与对手策略的不完美信息博弈算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙![](/image/person.jpg)
Adobe PDF(2515Kb)  |   收藏  |  浏览/下载:368/9  |  提交时间:2021/06/20 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| 基于值分解优化的多智能体深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 王凌霄![](/image/person.jpg)
Adobe PDF(13415Kb)  |   收藏  |  浏览/下载:205/9  |  提交时间:2021/06/15 深度强化学习 多智能体系统 价值函数分解算法 图神经网络 |