验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [7]

中国科学院分子影像重... [7]

复杂系统认知与决策实... [5]

学术期刊 [3]

09年以前成果 [2]

紫东太初大模型研究中... [1]

作者

liu yu ch... [2]

文献类型

期刊论文 [19]

会议论文 [6]

学位论文 [1]

发表日期

语种

出处

IEEE TRANS... [3]

Machine In... [2]

NATURE COM... [2]

ACS CHEMIC... [1]

ANALYTICAL... [1]

BIOMEDICAL... [1]

资助项目

National K... [3]

National N... [3]

National N... [3]

National N... [2]

Advanced I... [1]

Beijing Ad... [1]

收录类别

EI [4]

导师

资助机构

National N... [8]

National K... [3]

National K... [3]

National N... [2]

Natural Sc... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共27条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu; Haifeng Zhang; Jun Wang Adobe PDF(1339Kb) \| 收藏 \| 浏览/下载：9/1 \| 提交时间：2024/07/12
	Token-level Direct Preference Optimization 会议论文 , Vienna, Austria, 2024/7/21-27 作者: Zeng,Yongcheng; Liu,Guoqing; Ma,Weiyu; Yang,Ning; Zhang,Haifeng; Wang,Jun Adobe PDF(883Kb) \| 收藏 \| 浏览/下载：53/17 \| 提交时间：2024/06/05
	Joint caching and transmission in the mobile edge network: An multi-agent learning approach 会议论文 , Madrid, Spain, 2021-12-7 作者: Mi,Qirui; Yang,Ning; Zhang,Haifeng; Zhang,Haijun; Wang,Jun Adobe PDF(1724Kb) \| 收藏 \| 浏览/下载：36/11 \| 提交时间：2024/06/05
	Enhancing efficiency and propulsion in bio-mimetic robotic fish through end-to-end deep reinforcement learning 期刊论文 Physics of Fluids, 2024, 卷号: 36, 期号: 3, 页码: 031910 作者: Cui,Xinyu; Sun,Boai; Zhu,Yi; Yang,Ning; Zhang,Haifeng; Cui,Weicheng; Fan,Dixia; Wang,Jun Adobe PDF(4056Kb) \| 收藏 \| 浏览/下载：54/19 \| 提交时间：2024/06/02 bio-mimetic robotic fish deep reinforcement learning
	An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570 作者: Yan Song; He Jiang; Zheng Tian; Haifeng Zhang; Yingping Zhang; Jiangcheng Zhu; Zonghong Dai; Weinan Zhang; Jun Wang Adobe PDF(24588Kb) \| 收藏 \| 浏览/下载：49/11 \| 提交时间：2024/05/23 Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory
	基于门限和环签名的抗自适应攻击拜占庭容错共识算法期刊论文自动化学报, 2023, 卷号: 49, 期号: 7, 页码: 1471-1482 作者: 孙海锋; 张文芳; 王小敏; 马征; 黄路非; 李暄 Adobe PDF(2182Kb) \| 收藏 \| 浏览/下载：56/19 \| 提交时间：2024/04/25 区块链拜占庭容错共识算法自适应攻击环签名门限签名
	Offline Pre-trained Multi-agent Decision Transformer 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 233-248 作者: Linghui Meng; Muning Wen; Chenyang Le; Xiyun Li; Dengpeng Xing; Weinan Zhang; Ying Wen; Haifeng Zhang; Jun Wang; Yaodong Yang; Bo Xu Adobe PDF(2121Kb) \| 收藏 \| 浏览/下载：49/13 \| 提交时间：2024/04/23 Pre-training model multi-agent reinforcement learning (MARL) decision making transformer offline reinforcement learning
	Large sequence models for sequential decision-making: a survey 期刊论文 FRONTIERS OF COMPUTER SCIENCE, 2023, 卷号: 17, 期号: 6, 页码: 18 作者: Wen, Muning; Lin, Runji; Wang, Hanjing; Yang, Yaodong; Wen, Ying; Mai, Luo; Wang, Jun; Zhang, Haifeng; Zhang, Weinan Adobe PDF(1351Kb) \| 收藏 \| 浏览/下载：146/4 \| 提交时间：2023/11/17 sequential decision-making sequence modeling the Transformer training system
	A GAN-Based Short-Term Link Traffic Prediction Approach for Urban Road Networks Under a Parallel Learning Framework 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2022, 页码: 12 作者: Jin, Junchen; Rong, Dingding; Zhang, Tong; Ji, Qingyuan; Guo, Haifeng; Lv, Yisheng; Ma, Xiaoliang; Wang, Fei-Yue 收藏 \| 浏览/下载：275/0 \| 提交时间：2022/06/06 Roads Predictive models Data models Recurrent neural networks Generators Computer architecture Deep learning Short-term link speed prediction signalized urban networks Wasserstein generative adversarial network
	Integration of Train Control and Online Rescheduling for High-Speed Railways in Case of Emergencies 期刊论文 IEEE TRANSACTIONS ON COMPUTATIONAL SOCIAL SYSTEMS, 2021, 页码: 9 作者: Dong, Hairong; Liu, Xuan; Zhou, Min; Zheng, Wei; Xun, Jing; Gao, Shigen; Song, Haifeng; Li, Yidong; Wang, Fei-Yue 收藏 \| 浏览/下载：209/0 \| 提交时间：2022/01/27 Rail transportation Control systems Delays Dispatching Trajectory Wind Optimization Carrying capacity emergencies high-speed railways (HSRs) integration online rescheduling train control

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25752
全文量13633
访问量5639098
下载量871791

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495