验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [88]

学术期刊 [7]

离退休人员 [3]

复杂系统认知与决策实... [3]

紫东太初大模型研究中... [1]

复杂系统管理与控制国... [1]

作者

文献类型

期刊论文 [101]

会议论文 [2]

学位论文 [1]

发表日期

语种

出处

IEEE TRAN... [18]

IEEE TRAN... [15]

IEEE TRANS... [9]

NEUROCOMPU... [8]

IEEE TRANS... [6]

IEEE/CAA J... [6]

资助项目

National N... [9]

National N... [8]

National N... [7]

National N... [5]

National N... [3]

National N... [3]

收录类别

EI [2]

导师

资助机构

National ... [23]

Beijing N... [10]

Early Care... [9]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共104条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10 作者: Li, Luntong; Zhu, Yuanheng 收藏 \| 浏览/下载：14/0 \| 提交时间：2024/07/03 Artificial neural networks Vectors Task analysis Training Representation learning Approximation algorithms Optimization Actor-critic deep reinforcement learning (DRL) proximal policy optimization (PPO) shallow reinforcement learning (SRL)
	Adaptive bias-variance trade-off in advantage estimator for actor-critic algorithms 期刊论文 NEURAL NETWORKS, 2024, 卷号: 169, 页码: 764-777 作者: Chen, Yurou; Zhang, Fengyi; Liu, Zhiyong 收藏 \| 浏览/下载：63/0 \| 提交时间：2024/02/22 Reinforcement Learning Policy gradient Actor-critic Value function Bias-variance trade-off
	Path Planning and Tracking Control for Parking via Soft Actor-Critic Under Non-Ideal Scenarios 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 1, 页码: 181-195 作者: Xiaolin Tang; Yuyou Yang; Teng Liu; Xianke Lin; Kai Yang; Shen Li Adobe PDF(4905Kb) \| 收藏 \| 浏览/下载：246/138 \| 提交时间：2024/01/02 Automatic parking control strategy parking deviation (APS) soft actor-critic (SAC)
	Residual Reinforcement Learning for Motion Control of a Bionic Exploration Robot-RoboDact 期刊论文 IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT, 2023, 卷号: 72, 页码: 13 作者: Zhang, Tiandong; Wang, Rui; Wang, Shuo; Wang, Yu; Zheng, Gang; Tan, Min 收藏 \| 浏览/下载：124/0 \| 提交时间：2023/11/17 Active disturbance rejection control (ADRC) bionic exploration robot motion control residual reinforcement learning (RRL) soft actor-critic (SAC)
	Adaptive Multi-Step Evaluation Design With Stability Guarantee for Discrete-Time Optimal Learning Control 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 9, 页码: 1797-1809 作者: Ding Wang; Jiangyu Wang; Mingming Zhao; Peng Xin; Junfei Qiao Adobe PDF(5140Kb) \| 收藏 \| 浏览/下载：180/65 \| 提交时间：2023/08/10 Adaptive critic artificial neural networks Hamilton-Jacobi-Bellman (HJB) equation multi-step heuristic dynamic programming multi-step reinforcement learning optimal control
	Position and Attitude Tracking Control of a Biomimetic Underwater Vehicle via Deep Reinforcement Learning 期刊论文 IEEE/ASME Transactions on Mechatronics, 2023, 页码: 1-10 作者: Ma, Ruichen; Wang, Yu; Tang, Chong; Wang, Shuo; Wang, Rui 收藏 \| 浏览/下载：119/0 \| 提交时间：2023/08/03 Biomimetic underwater vehicle (BUV) Deep reinforcement learning (DRL) Soft actor-critic (SAC) Undulatory fin
	Policy Iteration for Optimal Control of Discrete-Time Time-Varying Nonlinear Systems 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 3, 页码: 781-791 作者: Guangyu Zhu; Xiaolu Li; Ranran Sun; Yiyuan Yang; Peng Zhang Adobe PDF(2432Kb) \| 收藏 \| 浏览/下载：273/78 \| 提交时间：2023/03/02 Adaptive critic designs adaptive dynamic programming approximate dynamic programming optimal control policy iteration time-varying
	Discounted Iterative Adaptive Critic Designs With Novel Stability Analysis for Tracking Control 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 7, 页码: 1262-1272 作者: Mingming Ha; Ding Wang; Derong Liu Adobe PDF(1832Kb) \| 收藏 \| 浏览/下载：262/88 \| 提交时间：2022/06/27 Adaptive critic design adaptive dynamic programming (ADP) approximate dynamic programming discrete-time nonlinear systems reinforcement learning stability analysis tracking control value iteration (VI)
	Self-Learning Robust Control Synthesis and Trajectory Tracking of Uncertain Dynamics 期刊论文 IEEE TRANSACTIONS ON CYBERNETICS, 2022, 卷号: 52, 期号: 1, 页码: 278-286 作者: Wang, Ding; Cheng, Long; Yan, Jun 收藏 \| 浏览/下载：265/0 \| 提交时间：2022/03/17 Robust control Optimal control Cost function Trajectory tracking Nonlinear systems Feedback control Dynamical systems Adaptive critic learning control synthesis neural networks optimization robust stabilization tracking design
	Neuro-Optimal Trajectory Tracking With Value Iteration of Discrete-Time Nonlinear Dynamics 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 12 作者: Wang, Ding; Ha, Mingming; Cheng, Long 收藏 \| 浏览/下载：300/0 \| 提交时间：2022/01/27 Trajectory Heuristic algorithms Convergence Trajectory tracking Stability criteria Optimal control Dynamic programming Adaptive critic design discrete-time nonlinear plants neuro-optimal trajectory tracking uniformly ultimately bounded stability value iteration

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25867
全文量13705
访问量5895004
下载量929100

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495