验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策... [14]

作者

文献类型

会议论文 [7]

学位论文 [4]

期刊论文 [3]

发表日期

2021 [14]

语种

出处

IEEE TRANS... [2]

资助项目

National N... [2]

Beijing Mu... [1]

Beijing Na... [1]

National K... [1]

National N... [1]

National N... [1]

收录类别

EI [8]

SCI [2]

导师

资助机构

National N... [2]

Beijing Mu... [1]

Beijing Na... [1]

National K... [1]

Youth Inno... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共14条，第1-10条

帮助

限定条件	发表日期：2021 专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning 会议论文 , 线上, 2022-02-22 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li JQ(李金秋); Li K(李凯); Xing JL(兴军亮) Adobe PDF(2593Kb) \| 收藏 \| 浏览/下载：126/52 \| 提交时间：2023/06/29
	Learning to Play Hard Exploration Games Using Graph-guided Self-navigation 会议论文 , 线上, 2021-02 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li K(李凯); Li LJ(李丽娟); Xing JL(兴军亮) Adobe PDF(413Kb) \| 收藏 \| 浏览/下载：136/52 \| 提交时间：2023/06/28
	Hierarchical Cooperative Swarm Policy Learning with Role Emergence 会议论文 , Online, 05-07 December 2021 作者: Zhang TL(张天乐); Liu Z(刘振); Pu ZQ(蒲志强); Qiu TH(丘腾海); Yi JQ(易建强) Adobe PDF(327Kb) \| 收藏 \| 浏览/下载：121/56 \| 提交时间：2023/06/12
	Semantic Perception Swarm Policy with Deep Reinforcement Learning 会议论文 , Online, 05 December 2021 作者: Zhang TL(张天乐); Liu Z(刘振); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(523Kb) \| 收藏 \| 浏览/下载：97/40 \| 提交时间：2023/06/12
	Multi-agent Collaborative Learning with Relational Graph Reasoning in Adversarial Environments 会议论文 , 线上会议, 2021-9 作者: Wu Shiguang; Qiu Tenghai; Pu Zhiqiang; Yi Jianqiang Adobe PDF(1396Kb) \| 收藏 \| 浏览/下载：229/67 \| 提交时间：2022/06/16
	Multi-target Coverage with Connectivity Maintenance using Knowledge-incorporated Policy Framework 会议论文 , Xi'an China, May 31-Jun. 4 作者: Shiguang Wu; Zhiqiang Pu; Zhen Liu; Tenghai Qiu; Jianqiang Yi; Tianle Zhang Adobe PDF(12862Kb) \| 收藏 \| 浏览/下载：253/37 \| 提交时间：2022/04/06
	Neuro-Optimal Trajectory Tracking With Value Iteration of Discrete-Time Nonlinear Dynamics 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 12 作者: Wang, Ding; Ha, Mingming; Cheng, Long 收藏 \| 浏览/下载：252/0 \| 提交时间：2022/01/27 Trajectory Heuristic algorithms Convergence Trajectory tracking Stability criteria Optimal control Dynamic programming Adaptive critic design discrete-time nonlinear plants neuro-optimal trajectory tracking uniformly ultimately bounded stability value iteration
	Target Tracking Control of a Biomimetic Underwater Vehicle Through Deep Reinforcement Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 12 作者: Wang, Yu; Tang, Chong; Wang, Shuo; Cheng, Long; Wang, Rui; Tan, Min; Hou, Zengguang 收藏 \| 浏览/下载：212/0 \| 提交时间：2022/01/27 Reinforcement learning Target tracking Robots Sports Aerospace electronics Mobile robots Underwater vehicles Biomimetic underwater vehicle (BUV) reinforcement learning target tracking control
	仿生滑翔机器鲸鲨的运动控制与自主对接充电研究学位论文 , 北京: 中国科学院大学, 2021 作者: 董会杰 Adobe PDF(7686Kb) \| 收藏 \| 浏览/下载：280/15 \| 提交时间：2021/12/31 仿生滑翔机器鲸鲨滑翔效率优化滑翔运动控制自主对接充电
	基于深度强化学习的群体协同决策关键问题研究学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木 Adobe PDF(8945Kb) \| 收藏 \| 浏览/下载：285/1 \| 提交时间：2021/06/24 群体系统协同决策多智能体系统深度强化学习图卷积网络注意力机制

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24614
全文量12448
访问量5112858
下载量788900

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495