验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [158]

复杂系统管理与控制国... [7]

复杂系统认知与决策实... [5]

中科院工业视觉智能装... [4]

离退休人员 [3]

综合信息系统研究中心 [2]

作者

文献类型

期刊论文 [161]

会议论文 [20]

发表日期

语种

英语 [181]

出处

NEUROCOMP... [21]

IEEE TRAN... [16]

IEEE TRAN... [16]

IEEE TRAN... [12]

IEEE TRAN... [11]

IET CONTRO... [8]

资助项目

National ... [10]

National N... [8]

National N... [7]

National N... [6]

Early Care... [4]

National N... [4]

收录类别

EI [16]

导师

资助机构

Early Car... [26]

National ... [25]

Beijing N... [23]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共181条，第1-10条

帮助

限定条件

语种：英语

已选(0)清除条数/页：排序方式：
	Continuous-Time Stochastic Policy Iteration of Adaptive Dynamic Programming 期刊论文 IEEE TRANSACTIONS ON SYSTEMS MAN CYBERNETICS-SYSTEMS, 2023, 页码: 13 作者: Wei, Qinglai; Zhou, Tianmin; Lu, Jingwei; Liu, Yu; Su, Shuai; Xiao, Jun 收藏 \| 浏览/下载：118/0 \| 提交时间：2023/11/17 Adaptive dynamic programming (ADP) Hamilton-Jacobi-Bellman equation (HJBE) nonlinear stochastic system stochastic policy iteration (PI)
	Learning to Manipulate Tools Using Deep Reinforcement Learning and Anchor Information 会议论文 , Jinghong, China, 05-09 December 2022 作者: Junhang Wei; Shaowei Cui; Peng Hao; Shuo Wang Adobe PDF(933Kb) \| 收藏 \| 浏览/下载：150/54 \| 提交时间：2023/10/25
	Sample-Observed Soft Actor-Critic Learning for Path Following of a Biomimetic Underwater Vehicle 期刊论文 IEEE Transactions on Automation Science and Engineering, 2023, 页码: 1-10 作者: Ma, Ruichen; Wang, Yu; Wang, Shuo; Cheng, Long; Wang, Rui; Tan, Ming Adobe PDF(2902Kb) \| 收藏 \| 浏览/下载：174/57 \| 提交时间：2023/08/03
	Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文 , 线上, 2020-4 作者: Zhao EM(赵恩民); Deng SH(邓诗弘); Zang YF(臧一凡); Kang YX(康永欣); Li K(李凯); Xing JL(兴军亮) Adobe PDF(1999Kb) \| 收藏 \| 浏览/下载：71/26 \| 提交时间：2023/06/29
	Stable Training of Bellman Error in Reinforcement Learning 会议论文 , Thailand, November 18–22 作者: Gong C(龚晨); Bai YP(白云鹏); Hou XW(侯新文); Ji XH(季晓慧) Adobe PDF(2416Kb) \| 收藏 \| 浏览/下载：94/28 \| 提交时间：2023/06/27
	A novel iterative adaptive critic design for smart home energy systems with solar energy 会议论文 , 中国厦门, 2022年11月作者: Liao ZH(廖泽华); Wei, Qinglai; Li, Hongyang Adobe PDF(965Kb) \| 收藏 \| 浏览/下载：155/71 \| 提交时间：2023/06/06
	Optimal Pedestrian Evacuation in Building with Consecutive Differential Dynamic Programming 会议论文 , Budapest, Hungary, 2019-7-14 作者: Zhu YH(朱圆恒); Haibo He; Dongbin Zhao; Zhongsheng Hou Adobe PDF(679Kb) \| 收藏 \| 浏览/下载：59/30 \| 提交时间：2023/05/22
	Traffic Signal Control Using Offline Reinforcement Learning 会议论文 , Beijing, 2021-10 作者: Dai, Xingyuan; Zhao, Chen; Li, Xiaoshuang; Wang, Xiao; Wang, Fei-Yue Adobe PDF(1130Kb) \| 收藏 \| 浏览/下载：179/50 \| 提交时间：2022/10/11
	Wd3: Taming the estimation bias in deep reinforcement learning 会议论文 , Baltimore, MD, USA, 2020-12 作者: He Q(何强); Hou XW(侯新文) Adobe PDF(2006Kb) \| 收藏 \| 浏览/下载：196/39 \| 提交时间：2022/06/27 deep reinforcement learning estimation bias neural networks
	POPO: Pessimistic Offline Policy Optimization 会议论文 , Singapore, Singapore, 23-27 May 2022 作者: He Q(何强); Hou XW(侯新文); Liu Y(刘禹) Adobe PDF(1200Kb) \| 收藏 \| 浏览/下载：181/37 \| 提交时间：2022/06/27 reinforcement learning offline optimization out-of-distribution

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24648
全文量12480
访问量5255764
下载量828485

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495