验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [3]

复杂系统认知与决策实... [2]

作者

文献类型

期刊论文 [5]

发表日期

语种

出处

IEEE TRANS... [5]

资助项目

National K... [2]

Beijing Mu... [1]

European U... [1]

External C... [1]

National K... [1]

National N... [1]

收录类别

SCI [5]

导师

资助机构

National N... [3]

National K... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共5条，第1-5条

帮助

限定条件	出处：IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS 文献类型：期刊论文

已选(0)清除条数/页：排序方式：
	Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241 作者: Zhu, Yuanheng; Zhao, Dongbin Adobe PDF(2838Kb) \| 收藏 \| 浏览/下载：230/4 \| 提交时间：2022/06/10 Games Nash equilibrium Mathematical model Markov processes Convergence Dynamic programming Training Deep reinforcement learning (DRL) generalized policy iteration (GPI) Markov game (MG) Nash equilibrium Q network zero sum
	Attention Enhanced Reinforcement Learning for Multi agent Cooperation 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 页码: 15 作者: Pu, Zhiqiang; Wang, Huimu; Liu, Zhen; Yi, Jianqiang; Wu, Shiguang Adobe PDF(2967Kb) \| 收藏 \| 浏览/下载：341/50 \| 提交时间：2022/06/06 Training Reinforcement learning Games Scalability Task analysis Standards Optimization Attention mechanism deep reinforcement learning (DRL) graph convolutional networks multi agent systems
	Target Tracking Control of a Biomimetic Underwater Vehicle Through Deep Reinforcement Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 12 作者: Wang, Yu; Tang, Chong; Wang, Shuo; Cheng, Long; Wang, Rui; Tan, Min; Hou, Zengguang 收藏 \| 浏览/下载：240/0 \| 提交时间：2022/01/27 Reinforcement learning Target tracking Robots Sports Aerospace electronics Mobile robots Underwater vehicles Biomimetic underwater vehicle (BUV) reinforcement learning target tracking control
	Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256 作者: Wei, Qinglai; Wang, Lingxiao; Liu, Yu; Polycarpou, Marios M. Adobe PDF(4019Kb) \| 收藏 \| 浏览/下载：361/82 \| 提交时间：2021/03/08 Elevators Optimal control Backpropagation Machine learning Neural networks Learning (artificial intelligence) Actor –critic adaptive dynamic programming deep learning (DL) elevator group control (EGC) optimal control reinforcement learning (RL)
	Model-Free Optimal Tracking Control via Critic-Only Q-Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2016, 卷号: 27, 期号: 10, 页码: 2134-2144 作者: Luo, Biao; Liu, Derong; Huang, Tingwen; Wang, Ding; Luo,Biao 浏览 \| Adobe PDF(1521Kb) \| 收藏 \| 浏览/下载：602/292 \| 提交时间：2016/10/24 Critic-only Q-learning (Coql) Model-free Nonaffine Nonlinear Systems Optimal Tracking Control

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25437
全文量13497
访问量5494477
下载量847071

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495