验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策实... [4]

多模态人工智能系统全... [1]

作者

文献类型

学位论文 [35]

发表日期

语种

出处

资助项目

National N... [2]

收录类别

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共35条，第1-10条

帮助

限定条件	文献类型：学位论文专题：硕士学位论文第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	稀疏奖励环境下基于自博弈框架的智能空战算法研究学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb) \| 收藏 \| 浏览/下载：13/0 \| 提交时间：2024/05/30 强化学习，离线强化学习，空战，智能决策，好奇心机制
	基于序列展开模型的多智能体方法研究学位论文 , 2024 作者: Luo ZX(罗正昕) Adobe PDF(13451Kb) \| 收藏 \| 浏览/下载：11/0 \| 提交时间：2024/05/30 多智能体强化学习序列展开模型信度分配非平稳性
	基于目标条件强化学习的无监督技能发现方法研究学位论文 , 2024 作者: 张天 Adobe PDF(13799Kb) \| 收藏 \| 浏览/下载：13/0 \| 提交时间：2024/05/30 目标稀疏奖励无监督强化学习探索技能策略
	连续控制任务中集成策略的多样性探索研究学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb) \| 收藏 \| 浏览/下载：11/0 \| 提交时间：2024/05/28 强化学习集成学习价值估计多样性探索
	面向可泛化、可解释强化学习的因果环境建模学位论文 , 2024 作者: 余忠蔚 Adobe PDF(9111Kb) \| 收藏 \| 浏览/下载：9/0 \| 提交时间：2024/05/28 强化学习因果推理环境模型
	多智能体策略一致性奖励塑造算法研究学位论文 , 2024 作者: 杨晨 Adobe PDF(6011Kb) \| 收藏 \| 浏览/下载：14/0 \| 提交时间：2024/05/27 多智能体系统深度强化学习信用分配奖励塑造
	复杂对抗条件下对手意图识别关键技术研究学位论文 , 2023 作者: 徐佳乐 Adobe PDF(3048Kb) \| 收藏 \| 浏览/下载：179/10 \| 提交时间：2023/06/28 不完美信息博弈多智能体策略博弈对手意图识别知识与数据融合事件图态势建模
	全局信息指导下的分布式多智能体协作算法研究学位论文 , 2023 作者: 陈逸群 Adobe PDF(42245Kb) \| 收藏 \| 浏览/下载：103/3 \| 提交时间：2023/06/27 强化学习，多智能体协作，全局信息，知识蒸馏
	足球比赛态势智能分析与决策辅助方法研究学位论文 , 2023 作者: 陈敏 Adobe PDF(8212Kb) \| 收藏 \| 浏览/下载：91/3 \| 提交时间：2023/06/27 足球态势分析深度学习多智能体强化学习迁移学习
	融合信息素机制的大规模多智能体协同技术学位论文 , 2023 作者: JiaHui Zhang Adobe PDF(5936Kb) \| 收藏 \| 浏览/下载：171/3 \| 提交时间：2023/06/26 大规模多智能体协同多智能体强化学习信息素机制知识蒸馏

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24899
全文量12752
访问量5191711
下载量796956

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495