验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [78]

学术期刊 [56]

复杂系统认知与决策... [24]

中国科学院分子影像... [20]

智能感知与计算研究... [13]

作者

文献类型

期刊论文 [150]

学位论文 [90]

会议论文 [52]

发表日期

语种

出处

IEEE/CAA ... [31]

Machine I... [13]

自动化学报 [11]

Internatio... [5]

IEEE TRANS... [4]

NEUROCOMPU... [3]

资助项目

Beijing Na... [2]

Developmen... [2]

National K... [2]

National K... [2]

National K... [2]

National N... [2]

收录类别

EI [35]

导师

资助机构

National ... [16]

Beijing Na... [4]

National K... [4]

National K... [3]

Strategic ... [3]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共295条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Optimal Strategy for Aircraft Pursuit-evasion Games via Self-play Iteration 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 585-596 作者: Xin Wang; Qing-Lai Wei; Tao Li; Jie Zhang Adobe PDF(1750Kb) \| 收藏 \| 浏览/下载：7/4 \| 提交时间：2024/05/23 Differential games, pursuit-evasion games, nonlinear control, optimal control, Nash equilibrium solution
	Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430 作者: Qiyue Yin; Tongtong Yu; Shengqi Shen; Jun Yang; Meijing Zhao; Wancheng Ni; Kaiqi Huang; Bin Liang; Liang Wang Adobe PDF(2923Kb) \| 收藏 \| 浏览/下载：4/3 \| 提交时间：2024/05/23 Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox
	Uncertainty-aware Deep Learning: A Promising Tool for Trustworthy Fault Diagnosis 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1317-1330 作者: Jiaxin Ren; Jingcheng Wen; Zhibin Zhao; Ruqiang Yan; Xuefeng Chen; Asoke K. Nandi Adobe PDF(16165Kb) \| 收藏 \| 浏览/下载：2/0 \| 提交时间：2024/05/22 Out-of-distribution detection traceability analysis trustworthy fault diagnosis uncertainty quantification
	深度强化学习的攻防与安全性分析综述期刊论文自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39 作者: 陈晋音; 章燕; 王雪柯; 蔡鸿斌; 王珏; 纪守领 Adobe PDF(3981Kb) \| 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/05/20 深度强化学习对抗攻击防御策略攻击安全性
	采用分类经验回放的深度确定性策略梯度方法期刊论文自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823 作者: 时圣苗; 刘全 Adobe PDF(19798Kb) \| 收藏 \| 浏览/下载：0/0 \| 提交时间：2024/05/20 连续控制任务深度确定性策略梯度经验回放分类经验回放
	基于多重注意结构的图像密集描述生成方法研究期刊论文自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2537-2548 作者: 刘青茹; 李刚; 赵创; 顾广华; 赵耀 Adobe PDF(5134Kb) \| 收藏 \| 浏览/下载：2/1 \| 提交时间：2024/05/20 图像密集描述多重注意结构多尺度特征环路融合多分支空间分步注意力
	基于因果建模的强化学习控制:现状及展望期刊论文自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677 作者: 孙悦雯; 柳文章; 孙长银 Adobe PDF(1926Kb) \| 收藏 \| 浏览/下载：13/4 \| 提交时间：2024/05/09 强化学习控制因果发现因果推理迁移学习表示学习
	多智能体博弈、学习与控制期刊论文自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613 作者: 王龙; 黄锋 Adobe PDF(2088Kb) \| 收藏 \| 浏览/下载：9/4 \| 提交时间：2024/05/09 博弈论多智能体学习控制论强化学习人工智能
	基于终端诱导强化学习的航天器轨道追逃博弈期刊论文自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984 作者: 耿远卓; 袁利; 黄煌; 汤亮 Adobe PDF(3292Kb) \| 收藏 \| 浏览/下载：1/1 \| 提交时间：2024/05/09 航天器追逃智能博弈近端策略优化奖励函数设计终端诱导
	安全强化学习综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(1356Kb) \| 收藏 \| 浏览/下载：11/5 \| 提交时间：2024/04/24 安全强化学习约束马尔科夫决策过程学习过程学习目标离线强化学习

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24577
全文量12414
访问量5147660
下载量793265

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495