×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
学术期刊 [85]
多模态人工智能系统... [16]
毕业生 [8]
复杂系统认知与决策实... [7]
中国科学院工业视觉智... [2]
作者
徐波 [3]
王宇 [3]
赵冬斌 [3]
魏庆来 [3]
丁磊 [2]
谭民 [2]
更多...
文献类型
期刊论文 [98]
学位论文 [9]
会议论文 [7]
发表日期
2023 [114]
语种
英语 [15]
中文 [9]
出处
IEEE/CAA ... [71]
自动化学报 [13]
IEEE-ASME ... [3]
Machine In... [3]
IEEE SENSO... [1]
IEEE TRANS... [1]
更多...
资助项目
Beijing Na... [2]
National N... [2]
National N... [2]
Beijing Mu... [1]
Beijing Mu... [1]
Beijing Na... [1]
更多...
收录类别
SCI [10]
EI [5]
其他 [2]
导师
资助机构
National N... [7]
National K... [4]
Beijing Na... [3]
Beijing Mu... [1]
Beijing No... [1]
Beijing Sc... [1]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共114条,第1-10条
帮助
限定条件
发表日期:2023
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
期刊影响因子升序
期刊影响因子降序
提交时间升序
提交时间降序
发表日期升序
发表日期降序
作者升序
作者降序
WOS被引频次升序
WOS被引频次降序
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs
会议论文
, 澳大利亚, 2023-6
作者:
Zhang Qingyang
;
Yang Yiming
;
Ruan Jingqing
;
Xiong Xuantang
;
Xing Dengpeng
;
Xu Bo
Adobe PDF(7948Kb)
  |  
收藏
  |  
浏览/下载:42/16
  |  
提交时间:2024/06/25
强化学习,分层强化学习
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning
期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:
Zhang Qingyang
;
Zhang Hongming
;
Xing Dengpeng
;
Bo Xu
Adobe PDF(9639Kb)
  |  
收藏
  |  
浏览/下载:23/11
  |  
提交时间:2024/06/25
Minimizing Age of Information for Mobile Edge Computing Systems: A Nested Index Approach
会议论文
, Singapore, 2023/8/24-27
作者:
Chen,Shuo
;
Yang,Ning
;
Zhang,Meng
;
Wang,Jun
Adobe PDF(1413Kb)
  |  
收藏
  |  
浏览/下载:53/11
  |  
提交时间:2024/06/05
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:
Wei, Qinglai
;
Li, Tao
Adobe PDF(8471Kb)
  |  
收藏
  |  
浏览/下载:65/23
  |  
提交时间:2024/05/28
Adaptive dynamic programming
approximate dynamic programming
constrained cost
optimal control
reinforcement learning
Parallel Learning Based Foundation Model for Networked Traffic Signal Control
会议论文
, Bilbao, Bizkaia, Spain, 2022-9-24
作者:
Zhao, Chen
;
Dai, Xingyuan
;
Chen, Yuanyuan
;
Yilun, Lin
;
Lv, Yisheng
;
Wang, Fei-Yue
Adobe PDF(1112Kb)
  |  
收藏
  |  
浏览/下载:37/15
  |  
提交时间:2024/05/28
基于自适应噪声的最大熵进化强化学习方法
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:
王君逸
;
王志
;
李华雄
;
陈春林
Adobe PDF(6435Kb)
  |  
收藏
  |  
浏览/下载:50/14
  |  
提交时间:2024/05/09
深度强化学习
进化策略
进化强化学习
最大熵
自适应噪声
基于宽度混合森林回归的城市固废焚烧过程二噁英排放软测量
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 343-365
作者:
夏恒
;
汤健
;
崔璨麟
;
乔俊飞
Adobe PDF(5017Kb)
  |  
收藏
  |  
浏览/下载:35/14
  |  
提交时间:2024/05/09
城市固废焚烧
二噁英排放建模
宽度学习
宽度混合森林回归
潜在特征
增量学习
航天器威胁规避智能自主控制技术研究综述
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 229-245
作者:
袁利
;
姜甜甜
Adobe PDF(2092Kb)
  |  
收藏
  |  
浏览/下载:64/19
  |  
提交时间:2024/05/09
轨道威胁感知
自主决策规划
“感知-决策-执行”一体化
航天器智能自主控制
航天器位姿运动一体化直接自适应容错控制研究
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 678-686
作者:
马亚杰
;
姜斌
;
任好
Adobe PDF(1709Kb)
  |  
收藏
  |  
浏览/下载:29/11
  |  
提交时间:2024/05/09
执行器故障
直接自适应控制
对偶四元数
多执行器故障
近距离操作
面向性能增强的双惯量伺服系统状态反馈控制
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 4, 页码: 904-912
作者:
王树波
;
那靖
;
任雪梅
Adobe PDF(5475Kb)
  |  
收藏
  |  
浏览/下载:20/7
  |  
提交时间:2024/05/09
双惯量伺服系统
状态反馈
预设性能函数
函数逼近器