×
验证码:
换一张
忘记密码?
记住我
切换中国科技网通行证登录
×
切换中国科技网通行证登录
登录
中文版
|
English
中国科学院自动化研究所机构知识库
Knowledge Commons of Institute of Automation,CAS
登录
注册
ALL
ORCID
题名
作者
导师
学科领域
关键词
资助项目
文献类型
出处
会议名称
收录类别
出版者
发表日期
存缴日期
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告
在结果中检索
研究单元&专题
毕业生 [18]
学术期刊 [17]
多模态人工智能系统全... [8]
复杂系统认知与决策实... [7]
离退休人员 [1]
舆论大数据科学与技术... [1]
更多...
作者
易建强 [4]
蒲志强 [4]
张天乐 [4]
王硕 [3]
王睿 [3]
王宇 [3]
更多...
文献类型
期刊论文 [28]
学位论文 [21]
会议论文 [3]
发表日期
2023 [52]
语种
中文 [21]
英语 [13]
出处
IEEE/CAA ... [12]
自动化学报 [4]
IEEE TRANS... [2]
Biomimetic... [1]
IEEE TRANS... [1]
IEEE TRANS... [1]
更多...
资助项目
Engineerin... [1]
External C... [1]
External C... [1]
External C... [1]
Guangdong ... [1]
Major Key ... [1]
更多...
收录类别
SCI [11]
其他 [4]
EI [2]
导师
资助机构
National K... [2]
Strategic ... [2]
Engineerin... [1]
External C... [1]
External C... [1]
Guangdong ... [1]
更多...
×
知识图谱
CASIA OpenIR
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共52条,第1-10条
帮助
限定条件
发表日期:2023
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
作者升序
作者降序
期刊影响因子升序
期刊影响因子降序
题名升序
题名降序
提交时间升序
提交时间降序
WOS被引频次升序
WOS被引频次降序
无人机反应式扰动流体路径规划
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287
作者:
吴健发
;
王宏伦
;
王延祥
;
刘一恒
Adobe PDF(4624Kb)
  |  
收藏
  |  
浏览/下载:7/3
  |  
提交时间:2024/05/09
无人机
反应式路径规划
受约束扰动流体动态系统
深度强化学习
训练环境
平行智能与CPSS:三十年发展的回顾与展望
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 614-634
作者:
杨静
;
王晓
;
王雨桐
;
刘忠民
;
李小双
;
王飞跃
Adobe PDF(12560Kb)
  |  
收藏
  |  
浏览/下载:10/2
  |  
提交时间:2024/05/09
社会物理信息系统
平行智能
人工系统
计算实验
平行执行
兵棋推演的智能决策技术与挑战
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:
尹奇跃
;
赵美静
;
倪晚成
;
张俊格
;
黄凯奇
Adobe PDF(4513Kb)
  |  
收藏
  |  
浏览/下载:11/7
  |  
提交时间:2024/05/09
兵棋推演
人机对抗
智能决策技术
博弈学习
A Survey on Recent Advances and Challenges in Reinforcement Learning Methods for Task-oriented Dialogue Policy Learning
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 318-334
作者:
Wai-Chung Kwan
;
Hong-Ru Wang
;
Hui-Min Wang
;
Kam-Fai Wong
Adobe PDF(2211Kb)
  |  
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/04/23
Dialogue policy learning (DPL), task-oriented dialogue system (TOD), reinforcement learning (RL), dialogue system, Markov decision process
异策略深度强化学习中的经验回放研究综述
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:
胡子剑
;
高晓光
;
万开方
;
张乐天
;
汪强龙
;
NERETINEvgeny
Adobe PDF(4679Kb)
  |  
收藏
  |  
浏览/下载:28/8
  |  
提交时间:2024/04/18
深度强化学习
异策略
经验回放
人工智能
Optimal adaptive nonpharmaceutical interventions to mitigate the outbreak of respiratory infections following the COVID-19 pandemic: a deep reinforcement learning study in Hong Kong, China
期刊论文
JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION, 2023, 页码: 9
作者:
Yao, Yao
;
Zhou, Hanchu
;
Cao, Zhidong
;
Zeng, Daniel Dajun
;
Zhang, Qingpeng
收藏
  |  
浏览/下载:87/0
  |  
提交时间:2023/11/17
Covid-19
reinforcement learning
artificial intelligence
machine learning
mathematical modelling
infectious diseases
Dependency-Aware Vehicular Task Scheduling Policy for Tracking Service VEC Networks
期刊论文
IEEE TRANSACTIONS ON INTELLIGENT VEHICLES, 2023, 卷号: 8, 期号: 3, 页码: 2400-2414
作者:
Li, Chao
;
Liu, Fagui
;
Wang, Bin
;
Chen, C. L. Philip
;
Tang, Xuhao
;
Jiang, Jun
;
Liu, Jie
收藏
  |  
浏览/下载:103/0
  |  
提交时间:2023/11/17
Task analysis
Intelligent vehicles
Optimization
Processor scheduling
Vehicle dynamics
Heuristic algorithms
Costs
Deep reinforcement learning (DRL)
scheduling policy
tracking service
vehicular edge computing (VEC)
Cognition-Driven Multiagent Policy Learning Framework for Promoting Cooperation
期刊论文
IEEE TRANSACTIONS ON GAMES, 2023, 卷号: 15, 期号: 3, 页码: 388-398
作者:
Pu, Zhiqiang
;
Wang, Huimu
;
Liu, Boyin
;
Yi, Jianqiang
收藏
  |  
浏览/下载:75/0
  |  
提交时间:2023/11/16
Cognition difference
coupling cognition network (CCN)
deep reinforcement learning (DRL)
graph convolutional network
multiagent systems (MASs)
Magnetic Field-Based Reward Shaping for Goal-Conditioned Reinforcement Learning
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 12, 页码: 2233-2247
作者:
Hongyu Ding
;
Yuanze Tang
;
Qing Wu
;
Bo Wang
;
Chunlin Chen
;
Zhi Wang
Adobe PDF(5205Kb)
  |  
收藏
  |  
浏览/下载:97/32
  |  
提交时间:2023/10/31
Dynamic environments
goal-conditioned reinforcement learning
magnetic field
reward shaping
面向工具使用的机器人技能学习方法研究
学位论文
, 2023
作者:
魏俊杭
Adobe PDF(15327Kb)
  |  
收藏
  |  
浏览/下载:163/10
  |  
提交时间:2023/10/25
机器人工具使用
多模态感知
自监督学习
复杂长序任务