验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [9]

复杂系统认知与决策实... [3]

作者

文献类型

期刊论文 [6]

会议论文 [5]

发表日期

2021 [11]

语种

英语 [11]

出处

IEEE TRANS... [3]

IEEE TRANS... [1]

IEEE TRANS... [1]

IEEE-CAA J... [1]

资助项目

National N... [3]

National K... [2]

National K... [2]

National N... [2]

Fundamenta... [1]

National K... [1]

收录类别

SCI [6]

EI [4]

导师

资助机构

National K... [4]

National N... [4]

Fundamenta... [1]

National S... [1]

Strategic ... [1]

Youth Inno... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共11条，第1-10条

帮助

限定条件	发表日期：2021 语种：英语

已选(0)清除条数/页：排序方式：
	Spiking Adaptive Dynamic Programming with Poisson Process 会议论文 , 中国山东省青岛市, 2021-07-18 作者: Wei QL(魏庆来); Han LY(韩立元); Zhang TL(张铁林) Adobe PDF(2334Kb) \| 收藏 \| 浏览/下载：31/9 \| 提交时间：2024/05/28
	AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning 会议论文 , 线上, 2022-02-22 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li JQ(李金秋); Li K(李凯); Xing JL(兴军亮) Adobe PDF(2593Kb) \| 收藏 \| 浏览/下载：184/70 \| 提交时间：2023/06/29
	Learning to Play Hard Exploration Games Using Graph-guided Self-navigation 会议论文 , 线上, 2021-02 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li K(李凯); Li LJ(李丽娟); Xing JL(兴军亮) Adobe PDF(413Kb) \| 收藏 \| 浏览/下载：160/57 \| 提交时间：2023/06/28
	ADEL: Autonomous Developmental Evolutionary Learning for Robotic Manipulation 会议论文 , 北京, 2021-8 作者: Li YM(李一鸣) Adobe PDF(9586Kb) \| 收藏 \| 浏览/下载：145/21 \| 提交时间：2022/06/16
	A Policy-Based Reinforcement Learning Approach for High-Speed Railway Timetable Rescheduling 会议论文 , Indianapolis, IN, USA, 19-22 Sept. 2021 作者: Yin Wang; Yisheng Lv; Jianying Zhou; Zhiming Yuan; Qi Zhang; Min Zhou Adobe PDF(1210Kb) \| 收藏 \| 浏览/下载：182/52 \| 提交时间：2022/04/08
	UNMAS: Multiagent Reinforcement Learning for Unshaped Cooperative Scenarios 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 12 作者: Chai, Jiajun; Li, Weifan; Zhu, Yuanheng; Zhao, Dongbin; Ma, Zhe; Sun, Kewu; Ding, Jishiyu Adobe PDF(3402Kb) \| 收藏 \| 浏览/下载：269/31 \| 提交时间：2022/01/27 Multi-agent systems Training Task analysis Reinforcement learning Sun Learning systems Semantics Centralized training with decentralized execution (CTDE) multiagent reinforcement learning StarCraft II
	Spiking Adaptive Dynamic Programming Based on Poisson Process for Discrete-Time Nonlinear Systems 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 11 作者: Wei, Qinglai; Han, Liyuan; Zhang, Tielin Adobe PDF(2904Kb) \| 收藏 \| 浏览/下载：216/9 \| 提交时间：2022/01/27 Maximum likelihood estimation (MLE) Nonlinear systems Optimal control Poisson process Spike train Spiking Adaptive dynamic programming（SADP）
	Decentralized Event-Driven Constrained Control Using Adaptive Critic Designs 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 15 作者: Yang, Xiong; Zhu, Yuanheng; Dong, Na; Wei, Qinglai Adobe PDF(1578Kb) \| 收藏 \| 浏览/下载：219/10 \| 提交时间：2022/01/27 Adaptive critic designs (ACDs) adaptive dynamic programming (ADP) decentralized event-driven control input constraint reinforcement learning (RL)
	Optimal Feedback Control of Pedestrian Flow in Heterogeneous Corridors 期刊论文 IEEE TRANSACTIONS ON AUTOMATION SCIENCE AND ENGINEERING, 2021, 卷号: 18, 期号: 3, 页码: 1097-1108 作者: Zhu, Yuanheng; Zhao, Dongbin; He, Haibo Adobe PDF(2666Kb) \| 收藏 \| 浏览/下载：211/9 \| 提交时间：2021/08/15 Microscopy Feedback control Mathematical model Data models Dynamic programming Psychology Computational modeling Adaptive dynamic programming (ADP) heterogeneous corridors macroscopic pedestrian dynamics optimal feedback control pedestrian flow
	Discrete-Time Non-Zero-Sum Games With Completely Unknown Dynamics 期刊论文 IEEE TRANSACTIONS ON CYBERNETICS, 2021, 卷号: 51, 期号: 6, 页码: 2929-2943 作者: Song, Ruizhuo; Wei, Qinglai; Zhang, Huaguang; Lewis, Frank L. 收藏 \| 浏览/下载：227/0 \| 提交时间：2021/08/15 Adaptive critic designs adaptive dynamic programming approximate dynamic programming discrete-time nonzero-sum (NZS) off-policy reinforcement learning (RL)

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25411
全文量13404
访问量5458128
下载量841608

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495