验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [16]

复杂系统认知与决策实... [7]

复杂系统管理与控制国... [5]

离退休人员 [2]

紫东太初大模型研究中... [2]

智能感知与计算研究中... [2]

作者

文献类型

期刊论文 [18]

会议论文 [14]

学位论文 [7]

研究报告 [1]

发表日期

2019 [41]

语种

出处

IEEE ACCES... [1]

IEEE Compu... [1]

IEEE TRANS... [1]

IEEE TRANS... [1]

IEEE TRANS... [1]

资助项目

National N... [3]

National K... [2]

National K... [2]

National N... [2]

National N... [2]

National N... [2]

收录类别

EI [10]

导师

资助机构

National N... [8]

Scientific... [2]

Beijing Na... [1]

Developmen... [1]

Doctoral F... [1]

Doctoral S... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共41条，第1-10条

帮助

限定条件

发表日期：2019

已选(0)清除条数/页：排序方式：
	Multi-Agent Reinforcement Learning Based on Clustering in Two-Player Games 会议论文 , Xiamen, China, 2019-12-6 作者: Li WF(李伟凡); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(488Kb) \| 收藏 \| 浏览/下载：103/34 \| 提交时间：2023/06/28 reinforcement learning unsupervised clustering matrix game
	Vision-based control in the open racing car simulator with deep and reinforcement learning 期刊论文 Journal of Ambient Intelligence and Humanized Computing, 2019, 页码: doi={10.1007/s12652-019-01503-y} 作者: Yuanheng Zhu; Dongbin Zhao Adobe PDF(2210Kb) \| 收藏 \| 浏览/下载：39/8 \| 提交时间：2023/04/26
	Learning to Navigate in Human Environments via Deep Reinforcement Learning 会议论文 , Sydney, Australia, 2019-12-12至2019-12-15 作者: Xingyuan Gao; Shiying Sun; Xiaoguang Zhao; Min Tan Adobe PDF(1298Kb) \| 收藏 \| 浏览/下载：144/42 \| 提交时间：2022/03/31
	Bootstrap Estimated Uncertainty of the Environment Model for Model-Based Reinforcement Learning 会议论文 , Honolulu, Hawaii, USA, 2019-1 作者: Huang, Wenzhen; Zhang, Junge; Huang, Kaiqi Adobe PDF(5079Kb) \| 收藏 \| 浏览/下载：124/40 \| 提交时间：2022/01/11
	MSCap: Multi-Style Image Captioning with Unpaired Stylized Text 会议论文 , 美国长滩, 2019.06.16 作者: Longteng, Guo; Jing, Liu; Peng, Yao; Jiangwei, Li; Hanqing, Lu Adobe PDF(914Kb) \| 收藏 \| 浏览/下载：109/19 \| 提交时间：2021/06/25
	Time-sequence Action-Decision and Navigation Through Stage Deep Reinforcement Learning in Complex Dynamic Environments 会议论文 , 厦门, 2019.12 作者: Huimu, Wang; Tenghai, Qiu; Zhen, Liu; Zhiqiang, Pu; Jianqiang, Yi; Zhaoyang, Liu Adobe PDF(2178Kb) \| 收藏 \| 浏览/下载：150/42 \| 提交时间：2021/06/24
	基于渐进式关系学习的群体行为识别模型及其训练方法专利专利类型: 发明专利, 专利号: 201910798505.X, 申请日期: 2019-08-27, 发明人: 胡古月; 余山; 崔波; 何媛 Adobe PDF(1041Kb) \| 收藏 \| 浏览/下载：112/0 \| 提交时间：2021/05/29
	Performance Evaluation and Improvement of Chipset Assembly & Test Production Line Based on Variability 期刊论文 International Journal of Automation and Computing, 2019, 卷号: 16, 期号: 2, 页码: 186-198 作者: Chang-Jun Li; Zong-Shi Xie; Xin-Ran Peng; Bo Li 浏览 \| Adobe PDF(1239Kb) \| 收藏 \| 浏览/下载：116/38 \| 提交时间：2021/02/22 Performance evaluation and improvement chipset assembly & test production line (CATPL) parameters Little′s law variability.
	Conservative Policy Gradient in Multi-critic Setting 会议论文 , Hangzhou, China, 2019.11.22-24 作者: Xi, Bao; Wang, Rui; Wang, Shuo; Lu, Tao; Cai, Yinghao 浏览 \| Adobe PDF(379Kb) \| 收藏 \| 浏览/下载：185/63 \| 提交时间：2021/02/02 inconsistancy stablility Q learning policy gradient
	Parallel Adaptive Critic Designs of Optimal Control for Ice-Storage Air Conditioning Systems 会议论文 , Xiamen, China, 2019-12 作者: Liao, Zehua; Wei, Qinglai; Song, Ruizhuo 浏览 \| Adobe PDF(199Kb) \| 收藏 \| 浏览/下载：270/73 \| 提交时间：2020/06/26 Parallel adaptive critic design Adaptive dynamic programming Particle swarm optimization Ice-storage air conditioning

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24471
全文量12301
访问量5075087
下载量799762

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495