验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策实... [9]

作者

文献类型

学位论文 [5]

期刊论文 [4]

发表日期

语种

出处

中国科学院大学学报 [2]

自动化学报 [2]

资助项目

National N... [4]

收录类别

EI [1]

中文核心期刊要目总览 [1]

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共9条，第1-9条

帮助

限定条件	专题：智能系统与工程第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	对抗场景中的智能体策略泛化研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb) \| 收藏 \| 浏览/下载：284/14 \| 提交时间：2022/06/16 深度强化学习多智能体策略泛化 Ad-Hoc 协作信用分配
	两人零和博弈中的对抗学习与适应算法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb) \| 收藏 \| 浏览/下载：182/5 \| 提交时间：2022/06/17 机器博弈两人零和博弈纳什均衡对手建模元学习
	对抗环境中基于值分解框架的多智能体协同算法研究学位论文工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb) \| 收藏 \| 浏览/下载：214/7 \| 提交时间：2022/06/13 多智能体协同，信用分配，贝叶斯超网络，部分可观测约束，贝叶斯神经网络
	基于不确定度的多智能体信用分配方法期刊论文中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb) \| 收藏 \| 浏览/下载：417/64 \| 提交时间：2022/07/12
	面向Ad-Hoc协作的局部观测重建方法期刊论文中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb) \| 收藏 \| 浏览/下载：203/36 \| 提交时间：2022/06/16 多智能体深度强化学习信用分配 Ad-Hoc协作
	一种用于两人零和博弈对手适应的元策略演化学习算法期刊论文自动化学报, 2022, 页码: 0 作者: 吴哲; 李凯; 徐航; 兴军亮 Adobe PDF(15953Kb) \| 收藏 \| 浏览/下载：181/42 \| 提交时间：2022/06/17
	基于演化学习与对手策略的不完美信息博弈算法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙 Adobe PDF(2515Kb) \| 收藏 \| 浏览/下载：357/9 \| 提交时间：2021/06/20 不完美信息博弈德州扑克演化学习在线对手建模种群策略集成
	一种针对德州扑克AI的对手建模与策略集成框架期刊论文自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙; 李凯; 吴哲; 臧一凡; 徐航; 兴军亮 Adobe PDF(1354Kb) \| 收藏 \| 浏览/下载：341/91 \| 提交时间：2021/06/21 不完美信息博弈德州扑克演化学习在线对手建模种群策略集成
	基于混合更新Q值的深度强化学习方法研究学位论文工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb) \| 收藏 \| 浏览/下载：185/5 \| 提交时间：2020/06/10 深度强化学习 Q 学习算法过估计欠估计 Actor-Critic 凸组合混合更新

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24467
全文量12297
访问量5010058
下载量798117

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495