验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [11]

离退休人员 [3]

学术期刊 [2]

复杂系统认知与决策实... [2]

紫东太初大模型研究中... [1]

09年以前成果 [1]

作者

文献类型

期刊论文 [19]

学位论文 [1]

发表日期

语种

出处

IEEE TRANS... [3]

IEEE TRANS... [2]

ARTIFICIAL... [1]

FRONTIERS ... [1]

IEEE TRANS... [1]

IEEE TRANS... [1]

资助项目

National N... [3]

Doctoral S... [2]

Macau Scie... [2]

Macau Scie... [2]

Macau Scie... [2]

National N... [2]

收录类别

导师

资助机构

National N... [9]

Beijing Na... [2]

Doctoral S... [2]

Macau Scie... [2]

Shandong P... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共20条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10 作者: Li, Luntong; Zhu, Yuanheng 收藏 \| 浏览/下载：14/0 \| 提交时间：2024/07/03 Artificial neural networks Vectors Task analysis Training Representation learning Approximation algorithms Optimization Actor-critic deep reinforcement learning (DRL) proximal policy optimization (PPO) shallow reinforcement learning (SRL)
	Adaptive bias-variance trade-off in advantage estimator for actor-critic algorithms 期刊论文 NEURAL NETWORKS, 2024, 卷号: 169, 页码: 764-777 作者: Chen, Yurou; Zhang, Fengyi; Liu, Zhiyong 收藏 \| 浏览/下载：63/0 \| 提交时间：2024/02/22 Reinforcement Learning Policy gradient Actor-critic Value function Bias-variance trade-off
	Path Planning and Tracking Control for Parking via Soft Actor-Critic Under Non-Ideal Scenarios 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 1, 页码: 181-195 作者: Xiaolin Tang; Yuyou Yang; Teng Liu; Xianke Lin; Kai Yang; Shen Li Adobe PDF(4905Kb) \| 收藏 \| 浏览/下载：246/138 \| 提交时间：2024/01/02 Automatic parking control strategy parking deviation (APS) soft actor-critic (SAC)
	Residual Reinforcement Learning for Motion Control of a Bionic Exploration Robot-RoboDact 期刊论文 IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT, 2023, 卷号: 72, 页码: 13 作者: Zhang, Tiandong; Wang, Rui; Wang, Shuo; Wang, Yu; Zheng, Gang; Tan, Min 收藏 \| 浏览/下载：124/0 \| 提交时间：2023/11/17 Active disturbance rejection control (ADRC) bionic exploration robot motion control residual reinforcement learning (RRL) soft actor-critic (SAC)
	Mixture of personality improved spiking actor network for efficient multi-agent cooperation 期刊论文 FRONTIERS IN NEUROSCIENCE, 2023, 卷号: 17, 页码: 14 作者: Li, Xiyun; Ni, Ziyi; Ruan, Jingqing; Meng, Linghui; Shi, Jing; Zhang, Tielin; Xu, Bo 收藏 \| 浏览/下载：104/0 \| 提交时间：2023/11/17 multi-agent cooperation personality theory spiking actor networks multi-agent reinforcement learning theory of mind
	Position and Attitude Tracking Control of a Biomimetic Underwater Vehicle via Deep Reinforcement Learning 期刊论文 IEEE/ASME Transactions on Mechatronics, 2023, 页码: 1-10 作者: Ma, Ruichen; Wang, Yu; Tang, Chong; Wang, Shuo; Wang, Rui 收藏 \| 浏览/下载：119/0 \| 提交时间：2023/08/03 Biomimetic underwater vehicle (BUV) Deep reinforcement learning (DRL) Soft actor-critic (SAC) Undulatory fin
	Sparse online kernelized actor-critic Learning in reproducing kernel Hilbert space 期刊论文 ARTIFICIAL INTELLIGENCE REVIEW, 2021, 页码: 36 作者: Yang, Yongliang; Zhu, Hufei; Zhang, Qichao; Zhao, Bo; Li, Zhenning; Wunsch, Donald C. 收藏 \| 浏览/下载：238/0 \| 提交时间：2021/11/02 Reproducing kernel Hilbert space Actor-critic learning Value function approximation Online sparsification Non-parametric learning
	Generalized Actor-Critic Learning Optimal Control in Smart Home Energy Management 期刊论文 IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2021, 卷号: 17, 期号: 10, 页码: 6614-6623 作者: Wei, Qinglai; Liao, Zehua; Shi, Guang Adobe PDF(1229Kb) \| 收藏 \| 浏览/下载：294/39 \| 提交时间：2021/11/02 Optimal control Process control Smart homes Dynamic programming Numerical models Iterative methods Informatics Actor-critic learning adaptive critic designs adaptive dynamic programming (ADP) approximate dynamic programming energy management optimal control smart grid
	A Novel Heterogeneous Actor-critic Algorithm with Recent Emphasizing Replay Memory 期刊论文 International Journal of Automation and Computing, 2021, 卷号: 18, 期号: 4, 页码: 619-631 作者: Bao Xi; Rui Wang; Ying-Hao Cai; TaoLu; Shuo Wang Adobe PDF(2505Kb) \| 收藏 \| 浏览/下载：212/61 \| 提交时间：2021/07/20 Reinforcement learning (RL) actor-critic experience replay training efficiency manipulation skill learning
	Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256 作者: Wei, Qinglai; Wang, Lingxiao; Liu, Yu; Polycarpou, Marios M. Adobe PDF(4019Kb) \| 收藏 \| 浏览/下载：390/88 \| 提交时间：2021/03/08 Elevators Optimal control Backpropagation Machine learning Neural networks Learning (artificial intelligence) Actor –critic adaptive dynamic programming deep learning (DL) elevator group control (EGC) optimal control reinforcement learning (RL)

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25867
全文量13705
访问量5894999
下载量929099

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495