验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策实... [5]

作者

文献类型

学位论文 [3]

会议论文 [2]

发表日期

语种

出处

资助项目

National N... [1]

收录类别

EI [2]

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共5条，第1-5条

帮助

限定条件	专题：智能系统与工程第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	对抗场景中的智能体策略泛化研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb) \| 收藏 \| 浏览/下载：292/14 \| 提交时间：2022/06/16 深度强化学习多智能体策略泛化 Ad-Hoc 协作信用分配
	两人零和博弈中的对抗学习与适应算法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb) \| 收藏 \| 浏览/下载：185/5 \| 提交时间：2022/06/17 机器博弈两人零和博弈纳什均衡对手建模元学习
	MiaoSuan Wargame: A Multi-Mode Integrated Platform for Imperfect Information Game 会议论文 , Beijing, China, August 21-24, 2022 作者: Jiale Xu; Jian Hu; Shixian Wang; Xuyang Yang; Wancheng Ni Adobe PDF(726Kb) \| 收藏 \| 浏览/下载：61/17 \| 提交时间：2023/06/28 open platform human-computer gaming AI evaluation Turing test imperfect information game wargame
	基于混合更新Q值的深度强化学习方法研究学位论文工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb) \| 收藏 \| 浏览/下载：186/5 \| 提交时间：2020/06/10 深度强化学习 Q 学习算法过估计欠估计 Actor-Critic 凸组合混合更新
	Mixing Update Q-value for Deep Reinforcement Learning 会议论文 , Budapest, Hungary, 2019/7/14-19 作者: Li Zhunan; Hou Xinwen 浏览 \| Adobe PDF(468Kb) \| 收藏 \| 浏览/下载：157/64 \| 提交时间：2020/06/10

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24471
全文量12301
访问量5091482
下载量800881

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495