验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策实... [7]

作者

文献类型

学位论文 [7]

发表日期

语种

出处

资助项目

National N... [2]

收录类别

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共7条，第1-7条

帮助

限定条件	文献类型：学位论文专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	稀疏奖励环境下基于自博弈框架的智能空战算法研究学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb) \| 收藏 \| 浏览/下载：37/1 \| 提交时间：2024/05/30 强化学习，离线强化学习，空战，智能决策，好奇心机制
	两人零和博弈中的对抗学习与适应算法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb) \| 收藏 \| 浏览/下载：209/5 \| 提交时间：2022/06/17 机器博弈两人零和博弈纳什均衡对手建模元学习
	对抗场景中的智能体策略泛化研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb) \| 收藏 \| 浏览/下载：331/14 \| 提交时间：2022/06/16 深度强化学习多智能体策略泛化 Ad-Hoc 协作信用分配
	对抗环境中基于值分解框架的多智能体协同算法研究学位论文工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb) \| 收藏 \| 浏览/下载：244/7 \| 提交时间：2022/06/13 多智能体协同，信用分配，贝叶斯超网络，部分可观测约束，贝叶斯神经网络
	高超声速飞行器不确定性抑制控制方法研究学位论文工学博士, 北京: 中国科学院大学, 2021 作者: 孙金林 Adobe PDF(18036Kb) \| 收藏 \| 浏览/下载：287/1 \| 提交时间：2021/06/28 高超声速飞行器不确定性抑制自适应模糊控制抗干扰控制有限时间控制
	基于深度强化学习的群体协同决策关键问题研究学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木 Adobe PDF(8945Kb) \| 收藏 \| 浏览/下载：309/1 \| 提交时间：2021/06/24 群体系统协同决策多智能体系统深度强化学习图卷积网络注意力机制
	基于演化学习与对手策略的不完美信息博弈算法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙 Adobe PDF(2515Kb) \| 收藏 \| 浏览/下载：372/9 \| 提交时间：2021/06/20 不完美信息博弈德州扑克演化学习在线对手建模种群策略集成

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25742
全文量13624
访问量5613622
下载量868211

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495