×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
多模态人工智能系... [247]
毕业生 [127]
学术期刊 [86]
复杂系统认知与决策... [68]
智能感知与计算研究... [21]
脑图谱与类脑智能实验... [9]
更多...
作者
赵冬斌 [65]
朱圆恒 [35]
王鼎 [31]
魏庆来 [30]
张启超 [20]
易建强 [20]
更多...
文献类型
期刊论文 [273]
学位论文 [164]
会议论文 [135]
其他 [8]
期刊 [2]
研究报告 [2]
更多...
发表日期
2024 [16]
2023 [91]
2022 [98]
2021 [83]
2020 [68]
2019 [50]
更多...
语种
英语 [231]
中文 [155]
出处
IEEE/CAA ... [73]
IEEE TRAN... [21]
NEUROCOMPU... [9]
IEEE TRANS... [8]
IEEE TRANS... [8]
自动化学报 [8]
更多...
资助项目
National N... [9]
National N... [8]
National N... [6]
National N... [5]
National N... [5]
National N... [4]
更多...
收录类别
SCI [170]
EI [77]
其他 [5]
SSCI [3]
ISTP [2]
CPCI-T [1]
更多...
导师
刘德荣 [11]
赵冬斌 [11]
王飞跃 [10]
谭民 [7]
黄凯奇 [5]
侯增广 [4]
更多...
资助机构
National ... [51]
National ... [21]
61273140 [8]
61533017 [8]
Early Care... [8]
61304086 [7]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共585条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
WOS被引频次升序
WOS被引频次降序
提交时间升序
提交时间降序
题名升序
题名降序
期刊影响因子升序
期刊影响因子降序
发表日期升序
发表日期降序
A Survey on Recent Advances and Challenges in Reinforcement Learning Methods for Task-oriented Dialogue Policy Learning
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 318-334
作者:
Wai-Chung Kwan
;
Hong-Ru Wang
;
Hui-Min Wang
;
Kam-Fai Wong
Adobe PDF(2211Kb)
  |  
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/04/23
Dialogue policy learning (DPL), task-oriented dialogue system (TOD), reinforcement learning (RL), dialogue system, Markov decision process
Offline Pre-trained Multi-agent Decision Transformer
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 233-248
作者:
Linghui Meng
;
Muning Wen
;
Chenyang Le
;
Xiyun Li
;
Dengpeng Xing
;
Weinan Zhang
;
Ying Wen
;
Haifeng Zhang
;
Jun Wang
;
Yaodong Yang
;
Bo Xu
Adobe PDF(2121Kb)
  |  
收藏
  |  
浏览/下载:4/1
  |  
提交时间:2024/04/23
Pre-training model
multi-agent reinforcement learning (MARL)
decision making
transformer
offline reinforcement learning
A Dynamic Resource Allocation Strategy with Reinforcement Learning for Multimodal Multi-objective Optimization
期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 2, 页码: 138-152
作者:
Qian-Long Dang
;
Wei Xu
;
Yang-Fei Yuan
Adobe PDF(2376Kb)
  |  
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/04/23
Multimodal multi-objective optimization (MMO)
dynamic resource allocating strategy (DRAS)
reinforcement learning (RL)
decision space partition
zoning search
基于自适应动态规划的移动机器人视觉伺服跟踪控制
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2286-2296
作者:
罗彪
;
欧阳志华
;
易昕宁
;
刘德荣
Adobe PDF(2335Kb)
  |  
收藏
  |  
浏览/下载:9/4
  |  
提交时间:2024/04/18
自适应动态规划
移动机器人
视觉伺服
轨迹跟踪
神经网络控制
异策略深度强化学习中的经验回放研究综述
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:
胡子剑
;
高晓光
;
万开方
;
张乐天
;
汪强龙
;
NERETINEvgeny
Adobe PDF(4679Kb)
  |  
收藏
  |  
浏览/下载:6/2
  |  
提交时间:2024/04/18
深度强化学习
异策略
经验回放
人工智能
基于滚动时域强化学习的智能车辆侧向控制算法
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 12, 页码: 2481-2492
作者:
张兴龙
;
陆阳
;
李文璋
;
徐昕
Adobe PDF(7533Kb)
  |  
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2024/04/17
滚动时域
强化学习
智能汽车
侧向控制
基于优先采样模型的离线强化学习
期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:
顾扬
;
程玉虎
;
王雪松
Adobe PDF(2677Kb)
  |  
收藏
  |  
浏览/下载:31/7
  |  
提交时间:2024/04/12
离线强化学习
优先采样模型
时序差分误差
鞅
批约束深度Q学习
重大装备制造多机器人任务分配与运动规划技术研究综述
期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41
作者:
张振国
;
毛建旭
;
谭浩然
;
王耀南
;
张雪波
;
江一鸣
Adobe PDF(16325Kb)
  |  
收藏
  |  
浏览/下载:7/2
  |  
提交时间:2024/04/12
重大装备制造
多机器人
任务分配
运动规划
基于平行测试的认知自动驾驶智能架构研究
期刊论文
自动化学报, 2024, 卷号: 50, 期号: 2, 页码: 356-371
作者:
王晓
;
张翔宇
;
周锐
;
田永林
;
王建功
;
陈龙
;
孙长银
Adobe PDF(5843Kb)
  |  
收藏
  |  
浏览/下载:14/6
  |  
提交时间:2024/04/12
认知自动驾驶
平行测试
平行驾驶
车辆认知智能
高超声速变外形飞行器建模与固定时间预设性能控制
期刊论文
自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 486-504
作者:
曹承钰
;
李繁飙
;
廖宇新
;
殷泽阳
;
桂卫华
Adobe PDF(3659Kb)
  |  
收藏
  |  
浏览/下载:11/3
  |  
提交时间:2024/04/10
高超声速变外形飞行器
固定时间
预设性能
干扰观测器
动态面控制