验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [23]

学术期刊 [6]

复杂系统认知与决策实... [4]

综合信息系统研究中心 [1]

模式识别实验室 [1]

作者

文献类型

期刊论文 [19]

学位论文 [17]

会议论文 [10]

发表日期

语种

出处

IEEE/CAA J... [4]

IEEE TRANS... [2]

NEUROCOMPU... [2]

ARTIFICIAL... [1]

Advanced I... [1]

BIOMIMETIC... [1]

资助项目

National K... [2]

National K... [2]

National N... [2]

National N... [2]

Key Resear... [1]

Key-Area R... [1]

收录类别

EI [8]

导师

资助机构

National N... [5]

National K... [2]

National K... [2]

Key Resear... [1]

Key-Area R... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共47条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	基于基础模型的分层强化学习学位论文 , 2024 作者: 吴俣桥 Adobe PDF(16716Kb) \| 收藏 \| 浏览/下载：32/0 \| 提交时间：2024/06/21 强化学习分层强化学习基础模型
	基于预训练模型的决策序列化建模研究学位论文 , 2024 作者: 林润基 Adobe PDF(7811Kb) \| 收藏 \| 浏览/下载：59/1 \| 提交时间：2024/06/07 预训练模型决策序列化序列模型
	Parallel Population and Parallel Human---A Cyber-Physical Social Approach 期刊论文 IEEE Intelligent Systems, 2022, 卷号: 37, 期号: 5, 页码: 19-27 作者: Peijun Ye; Fei-Yue Wang Adobe PDF(3009Kb) \| 收藏 \| 浏览/下载：41/12 \| 提交时间：2024/06/06 Parallel Human
	MOT: A Mixture of Actors Reinforcement Learning Method by Optimal Transport for Algorithmic Trading 会议论文 , 台湾台北, 20240507-20240510 作者: Cheng X(程曦); Zhang JH(张景昊); Ceng YN(曾宇楠); Xue WF(薛文芳) Adobe PDF(739Kb) \| 收藏 \| 浏览/下载：31/8 \| 提交时间：2024/06/03
	Traffic Signal Control Based on Reinforcement Learning and Fuzzy Neural Network 会议论文 , Macau, China, October 8-12, 2022 作者: Zhao, Hongxia; Chen, Songhang; Zhu, Fenghua; Tang, Haina Adobe PDF(565Kb) \| 收藏 \| 浏览/下载：29/12 \| 提交时间：2024/06/03
	Advancing Air Combat Tactics with Improved Neural Fictitious Self-Play Reinforcement Learning 会议论文 Advanced Intelligent Computing Technology and Applications, 中国郑州, 2023-8 作者: He SQ(何少钦); Gao Y(高阳); Zhang BF(张保丰); Chang H(常惠); Zhang XC(张鑫辰) Adobe PDF(1496Kb) \| 收藏 \| 浏览/下载：45/14 \| 提交时间：2024/05/31 Air Combat, Reinforcement Learning, Neural Fictitious Self-Play.
	基于强化学习的机器人操作策略表征与学习学位论文 , 2024 作者: 杨依明 Adobe PDF(19731Kb) \| 收藏 \| 浏览/下载：43/5 \| 提交时间：2024/05/28 强化学习机器人操作机器人控制策略表征
	D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文 , 中国重庆, 2024.5.7-5.9 作者: Niu LY(钮龙宇); Wan J(万军) Adobe PDF(1645Kb) \| 收藏 \| 浏览/下载：37/8 \| 提交时间：2024/05/28 深度强化学习表征学习分层学习
	面向高仿真场景的深度强化学习算法研究学位论文 , 2024 作者: 钮龙宇 Adobe PDF(9528Kb) \| 收藏 \| 浏览/下载：27/0 \| 提交时间：2024/05/28 深度强化学习高仿真场景分层学习模仿学习表征学习
	多智能体强化学习预训练方法研究学位论文 , 2024 作者: 孟令辉 Adobe PDF(6367Kb) \| 收藏 \| 浏览/下载：63/6 \| 提交时间：2024/05/28 多智能体强化学习预训练方法神经网络表示学习在线强化评估

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25752
全文量13633
访问量5636150
下载量871401

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495