验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

学术期刊 [71]

多模态人工智能系统... [71]

复杂系统认知与决策... [10]

中科院工业视觉智能装... [3]

脑图谱与类脑智能实验... [2]

作者

文献类型

期刊论文 [158]

发表日期

语种

出处

IEEE/CAA ... [52]

IEEE TRAN... [11]

自动化学报 [11]

IEEE TRANS... [8]

Machine In... [8]

NEUROCOMPU... [6]

资助项目

National N... [7]

National N... [5]

National N... [3]

Developmen... [2]

National K... [2]

National K... [2]

收录类别

EI [2]

中文核心期刊要目总览 [1]

导师

资助机构

National ... [18]

Early Care... [6]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共158条，第1-10条

帮助

限定条件

文献类型：期刊论文

已选(0)清除条数/页：排序方式：
	融合自适应评判的随机系统数据驱动策略优化期刊论文自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990 作者: 王鼎; 王将宇; 乔俊飞 Adobe PDF(2044Kb) \| 收藏 \| 浏览/下载：6/2 \| 提交时间：2024/05/30 自适应评判设计数据驱动离散系统神经网络 Q-learning 随机最优控制
	Learning Playing Piano with Bionic-Constrained Diffusion Policy for Anthropomorphic Hand 期刊论文 Cyborg and Bionic Systems, 2024, 卷号: 5, 页码: 0104 作者: Yang YM(杨依明); Wang ZC(王泽昌); Xing DP(邢登鹏); Wang P(王鹏) Adobe PDF(3500Kb) \| 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/05/30
	Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文 Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078 作者: Qiu JY(邱俊彦); Haidong Zhang; Yiping Yang Adobe PDF(831Kb) \| 收藏 \| 浏览/下载：7/1 \| 提交时间：2024/05/29 reinforcement learning dialogue policy learning curriculum learning knowledge distillation
	Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文 IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989 作者: Yang YM(杨依明); Xing DP(邢登鹏); Xu B(徐波) Adobe PDF(2469Kb) \| 收藏 \| 浏览/下载：6/1 \| 提交时间：2024/05/29
	CKDF: Cascaded Knowledge Distillation Framework for Robust Incremental Learning 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2022, 卷号: 31, 页码: 3825–3837 作者: Li KC(李焜炽); Wan J(万军); Yu S(余山) Adobe PDF(3813Kb) \| 收藏 \| 浏览/下载：9/3 \| 提交时间：2024/05/28
	An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570 作者: Yan Song; He Jiang; Zheng Tian; Haifeng Zhang; Yingping Zhang; Jiangcheng Zhu; Zonghong Dai; Weinan Zhang; Jun Wang Adobe PDF(24588Kb) \| 收藏 \| 浏览/下载：17/5 \| 提交时间：2024/05/23 Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory
	Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430 作者: Qiyue Yin; Tongtong Yu; Shengqi Shen; Jun Yang; Meijing Zhao; Wancheng Ni; Kaiqi Huang; Bin Liang; Liang Wang Adobe PDF(2923Kb) \| 收藏 \| 浏览/下载：13/7 \| 提交时间：2024/05/23 Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox
	深度强化学习的攻防与安全性分析综述期刊论文自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39 作者: 陈晋音; 章燕; 王雪柯; 蔡鸿斌; 王珏; 纪守领 Adobe PDF(3981Kb) \| 收藏 \| 浏览/下载：8/3 \| 提交时间：2024/05/20 深度强化学习对抗攻击防御策略攻击安全性
	采用分类经验回放的深度确定性策略梯度方法期刊论文自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823 作者: 时圣苗; 刘全 Adobe PDF(19798Kb) \| 收藏 \| 浏览/下载：2/0 \| 提交时间：2024/05/20 连续控制任务深度确定性策略梯度经验回放分类经验回放
	无人机反应式扰动流体路径规划期刊论文自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287 作者: 吴健发; 王宏伦; 王延祥; 刘一恒 Adobe PDF(4624Kb) \| 收藏 \| 浏览/下载：11/5 \| 提交时间：2024/05/09 无人机反应式路径规划受约束扰动流体动态系统深度强化学习训练环境

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24901
全文量12754
访问量5201340
下载量798463

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495