×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
学术期刊 [20]
多模态人工智能系统全... [3]
复杂系统认知与决策实... [1]
作者
程龙 [2]
谭民 [2]
王硕 [2]
王睿 [2]
王宇 [2]
张勇 [1]
更多...
文献类型
期刊论文 [24]
发表日期
2023 [24]
语种
英语 [3]
出处
IEEE/CAA ... [14]
Machine In... [3]
自动化学报 [3]
IEEE Trans... [1]
IEEE Trans... [1]
IEEE Trans... [1]
更多...
资助项目
收录类别
SCI [3]
导师
资助机构
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共24条,第1-10条
帮助
限定条件
发表日期:2023
文献类型:期刊论文
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
提交时间升序
提交时间降序
期刊影响因子升序
期刊影响因子降序
发表日期升序
发表日期降序
题名升序
题名降序
作者升序
作者降序
WOS被引频次升序
WOS被引频次降序
不确定工业过程运行指标异步更新强化学习决策算法
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:
李金娜
;
袁林
;
丁进良
Adobe PDF(1941Kb)
  |  
收藏
  |  
浏览/下载:3/1
  |  
提交时间:2024/05/09
运行优化控制
强化学习
数据驱动控制
自适应动态规划
安全运行
State of the Art on Deep Learning-enhanced Rendering Methods
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 6, 页码: 799-821
作者:
Qi Wang
;
Zhihua Zhong
;
Yuchi Huo
;
Hujun Bao
;
Rui Wang
Adobe PDF(6540Kb)
  |  
收藏
  |  
浏览/下载:15/7
  |  
提交时间:2024/04/23
Neural rendering, computer graphics, scene representation, rendering, post-processing
A Survey on Recent Advances and Challenges in Reinforcement Learning Methods for Task-oriented Dialogue Policy Learning
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 318-334
作者:
Wai-Chung Kwan
;
Hong-Ru Wang
;
Hui-Min Wang
;
Kam-Fai Wong
Adobe PDF(2211Kb)
  |  
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/04/23
Dialogue policy learning (DPL), task-oriented dialogue system (TOD), reinforcement learning (RL), dialogue system, Markov decision process
Offline Pre-trained Multi-agent Decision Transformer
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 233-248
作者:
Linghui Meng
;
Muning Wen
;
Chenyang Le
;
Xiyun Li
;
Dengpeng Xing
;
Weinan Zhang
;
Ying Wen
;
Haifeng Zhang
;
Jun Wang
;
Yaodong Yang
;
Bo Xu
Adobe PDF(2121Kb)
  |  
收藏
  |  
浏览/下载:11/5
  |  
提交时间:2024/04/23
Pre-training model
multi-agent reinforcement learning (MARL)
decision making
transformer
offline reinforcement learning
基于自适应动态规划的移动机器人视觉伺服跟踪控制
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2286-2296
作者:
罗彪
;
欧阳志华
;
易昕宁
;
刘德荣
Adobe PDF(2335Kb)
  |  
收藏
  |  
浏览/下载:18/7
  |  
提交时间:2024/04/18
自适应动态规划
移动机器人
视觉伺服
轨迹跟踪
神经网络控制
异策略深度强化学习中的经验回放研究综述
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:
胡子剑
;
高晓光
;
万开方
;
张乐天
;
汪强龙
;
NERETINEvgeny
Adobe PDF(4679Kb)
  |  
收藏
  |  
浏览/下载:23/7
  |  
提交时间:2024/04/18
深度强化学习
异策略
经验回放
人工智能
A Parallel Control Method For Zero-Sum Games With Unknown Time-varying System
期刊论文
The International Journal of Intelligent Control and Systems, 2023, 页码: 5页
作者:
Qinglai Wei
;
Zhenhua Zhu
;
Jie Zhang
;
Feiyue Wang
Adobe PDF(470Kb)
  |  
收藏
  |  
浏览/下载:122/48
  |  
提交时间:2023/12/15
Magnetic Field-Based Reward Shaping for Goal-Conditioned Reinforcement Learning
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 12, 页码: 2233-2247
作者:
Hongyu Ding
;
Yuanze Tang
;
Qing Wu
;
Bo Wang
;
Chunlin Chen
;
Zhi Wang
Adobe PDF(5205Kb)
  |  
收藏
  |  
浏览/下载:95/32
  |  
提交时间:2023/10/31
Dynamic environments
goal-conditioned reinforcement learning
magnetic field
reward shaping
Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999
作者:
Feiye Zhang
;
Qingyu Yang
;
Dou An
Adobe PDF(3841Kb)
  |  
收藏
  |  
浏览/下载:79/41
  |  
提交时间:2023/09/07
Centralized training and decentralized execution
demand side management
multi-agent reinforcement learning
privacy preserving
Adaptive Multi-Step Evaluation Design With Stability Guarantee for Discrete-Time Optimal Learning Control
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 9, 页码: 1797-1809
作者:
Ding Wang
;
Jiangyu Wang
;
Mingming Zhao
;
Peng Xin
;
Junfei Qiao
Adobe PDF(5140Kb)
  |  
收藏
  |  
浏览/下载:134/57
  |  
提交时间:2023/08/10
Adaptive critic
artificial neural networks
Hamilton-Jacobi-Bellman (HJB) equation
multi-step heuristic dynamic programming
multi-step reinforcement learning
optimal control