验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

学术期刊 [12]

多模态人工智能系统... [11]

中国科学院分子影像重... [5]

复杂系统认知与决策实... [2]

紫东太初大模型研究中... [2]

作者

文献类型

期刊论文 [25]

学位论文 [14]

会议论文 [10]

发表日期

语种

出处

自动化学报 [5]

Internatio... [4]

IEEE TRANS... [2]

Machine In... [2]

ACM TRANSA... [1]

APPLIED OP... [1]

资助项目

National N... [2]

National N... [2]

National N... [2]

111 Projec... [1]

Beijing Mu... [1]

Beijing Mu... [1]

收录类别

EI [5]

导师

李子青研究员 [1]

资助机构

National N... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共49条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文 IEEE Communications Surveys and Tutorials, 2024, 页码: 50 作者: Yang,Ning; Chen,Shuo; Zhang,Haijun; Berry,Randall Adobe PDF(1694Kb) \| 收藏 \| 浏览/下载：20/0 \| 提交时间：2024/06/01 Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication
	An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570 作者: Yan Song; He Jiang; Zheng Tian; Haifeng Zhang; Yingping Zhang; Jiangcheng Zhu; Zonghong Dai; Weinan Zhang; Jun Wang Adobe PDF(24588Kb) \| 收藏 \| 浏览/下载：21/6 \| 提交时间：2024/05/23 Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory
	结合领域知识的因子分析:在金融风险模型上的应用期刊论文自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 121-132 作者: 冯栩; 喻文健; 李凌 Adobe PDF(1436Kb) \| 收藏 \| 浏览/下载：2/0 \| 提交时间：2024/05/20 因子分析基本面因子领域知识风险模型期望最大化过程
	非侵入式负荷监测综述期刊论文自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 644-663 作者: 邓晓平; 张桂青; 魏庆来; 彭伟; 李成栋 Adobe PDF(13303Kb) \| 收藏 \| 浏览/下载：14/3 \| 提交时间：2024/05/20 非侵入式负荷监测负荷分解特征提取隐马尔科夫模型深度学习
	基于改进高斯混合模型的机器人运动状态估计期刊论文自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1972-1983 作者: 葛泉波; 王贺彬; 杨秦敏; 张兴国; 刘华平 Adobe PDF(1963Kb) \| 收藏 \| 浏览/下载：10/4 \| 提交时间：2024/05/20 非线性非高斯系统状态估计高斯和容积卡尔曼滤波鲁棒期望最大化算法凸组合融合
	深度EM胶囊网络全重叠手写数字识别与分离期刊论文自动化学报, 2022, 卷号: 48, 期号: 12, 页码: 2996-3005 作者: 姚红革; 董泽浩; 喻钧; 白小军 Adobe PDF(4650Kb) \| 收藏 \| 浏览/下载：5/2 \| 提交时间：2024/05/20 深度胶囊网络重叠数字识别重叠数字分离 EM向量聚类
	时滞取值概率未知下的线性时滞系统辨识方法期刊论文自动化学报, 2023, 卷号: 49, 期号: 10, 页码: 2136-2144 作者: 刘鑫 Adobe PDF(1474Kb) \| 收藏 \| 浏览/下载：8/3 \| 提交时间：2024/04/24 系统辨识参数估计时变时滞时滞取值概率未知
	Swarm Intelligence Research: From Bio-inspired Single-population Swarm Intelligence to Humanmachine Hybrid Swarm Intelligence 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 121-144 作者: Guo-Yin Wang; Dong-Dong Cheng; De-You Xia; Hai-Huan Jiang Adobe PDF(2487Kb) \| 收藏 \| 浏览/下载：21/7 \| 提交时间：2024/04/23 Swarm intelligence single-population multi-population human-machine hybrid multi-granularity
	Hierarchical Policy Learning With Demonstration Learning for Robotic Multiple Peg-in-Hole Assembly Tasks 期刊论文 IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2023, 卷号: 19, 期号: 10, 页码: 10254-10264 作者: Yan, Shaohua; Xu, De; Tao, Xian Adobe PDF(4845Kb) \| 收藏 \| 浏览/下载：89/2 \| 提交时间：2023/11/17 Assembly model demonstration learning (DL) force-based control algorithm hierarchical reinforcement learning (HRL) peg-in-hole assembly
	PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文 Proceedings of the AAAI Conference on Artificial Intelligence, 美国华盛顿, 2023.02.07 - 2023.02.14 作者: Bai FS(白丰硕); Zhang HM(张鸿铭); Tao TY(陶天阳); Wu ZH(武志亨); Wang YN(王燕娜); Xu B(徐博) Adobe PDF(1663Kb) \| 收藏 \| 浏览/下载：177/40 \| 提交时间：2023/07/05 Reinforcement Learning Algorithms Transfer Domain Adaptation Multi-Task Learning

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25122
全文量13052
访问量5256247
下载量805876

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495