验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

复杂系统认知与决策... [10]

多模态人工智能系统全... [2]

作者

文献类型

会议论文 [6]

期刊论文 [3]

学位论文 [1]

发表日期

语种

出处

IEEE TRANS... [1]

IEEE TRANS... [1]

IEEE Trans... [1]

Proceeding... [1]

资助项目

National K... [1]

National N... [1]

National N... [1]

收录类别

EI [3]

SCI [2]

导师

资助机构

National K... [1]

National N... [1]

Natural Sc... [1]

Shanghai R... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共10条，第1-10条

帮助

限定条件	专题：复杂系统认知与决策实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Power Control Based on Deep Reinforcement Learning for Spectrum Sharing 期刊论文 IEEE Transactions on Wireless Communications, 2024, 卷号: 19, 期号: 6, 页码: 4209-4219 作者: Zhang,Haijun; Yang,Ning; Huangfu,Wei; Long,Keping; Leung,VictorCM Adobe PDF(1925Kb) \| 收藏 \| 浏览/下载：23/10 \| 提交时间：2024/06/12
	Filtered Observations for Model-Based Multi-agent Reinforcement Learning 会议论文 , Turin, Italy, 2023.9.18-2023.9.22 作者: Meng Linghui; Xiong Xuantang; Zang Yifan; Zhang Xi; Li Guoqi; Xing Dengpeng; Xu Bo Adobe PDF(841Kb) \| 收藏 \| 浏览/下载：25/9 \| 提交时间：2024/06/11
	PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文 Proceedings of the AAAI Conference on Artificial Intelligence, 美国华盛顿, 2023.02.07 - 2023.02.14 作者: Bai FS(白丰硕); Zhang HM(张鸿铭); Tao TY(陶天阳); Wu ZH(武志亨); Wang YN(王燕娜); Xu B(徐博) Adobe PDF(1663Kb) \| 收藏 \| 浏览/下载：192/42 \| 提交时间：2023/07/05 Reinforcement Learning Algorithms Transfer Domain Adaptation Multi-Task Learning
	Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文 , 线上, 2020-4 作者: Zhao EM(赵恩民); Deng SH(邓诗弘); Zang YF(臧一凡); Kang YX(康永欣); Li K(李凯); Xing JL(兴军亮) Adobe PDF(1999Kb) \| 收藏 \| 浏览/下载：109/42 \| 提交时间：2023/06/29
	AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning 会议论文 , 线上, 2022-02-22 作者: Zhao EM(赵恩民); Yan RY(闫仁业); Li JQ(李金秋); Li K(李凯); Xing JL(兴军亮) Adobe PDF(2593Kb) \| 收藏 \| 浏览/下载：192/71 \| 提交时间：2023/06/29
	L2E: Learning to Exploit Your Opponent 会议论文 , 意大利帕多瓦, 2022.07.18-2022.07.23 作者: Wu Zhe; Li Kai; Xu Hang; Zang Yifan; An Bo; Xing Junliang Adobe PDF(5676Kb) \| 收藏 \| 浏览/下载：217/44 \| 提交时间：2022/06/17
	Learning to Navigate in Human Environments via Deep Reinforcement Learning 会议论文 , Sydney, Australia, 2019-12-12至2019-12-15 作者: Xingyuan Gao; Shiying Sun; Xiaoguang Zhao; Min Tan Adobe PDF(1298Kb) \| 收藏 \| 浏览/下载：239/59 \| 提交时间：2022/03/31
	Spiking Adaptive Dynamic Programming Based on Poisson Process for Discrete-Time Nonlinear Systems 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 11 作者: Wei, Qinglai; Han, Liyuan; Zhang, Tielin Adobe PDF(2904Kb) \| 收藏 \| 浏览/下载：221/9 \| 提交时间：2022/01/27 Maximum likelihood estimation (MLE) Nonlinear systems Optimal control Poisson process Spike train Spiking Adaptive dynamic programming（SADP）
	基于混合更新Q值的深度强化学习方法研究学位论文工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb) \| 收藏 \| 浏览/下载：206/5 \| 提交时间：2020/06/10 深度强化学习 Q 学习算法过估计欠估计 Actor-Critic 凸组合混合更新
	An Incidental Delivery Based Method for Resolving Multirobot Pairwised Transportation Problems 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2016, 卷号: 17, 期号: 7, 页码: 1852-1866 作者: Liu, Zhe; Wang, Hesheng; Chen, Weidong; Yu, Junzhi; Chen, Jian Adobe PDF(3291Kb) \| 收藏 \| 浏览/下载：329/85 \| 提交时间：2016/10/20 Incidental Delivery Multirobot Pairwised Transportation (Mrpwt) Simulated Annealing

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25724
全文量13599
访问量5548104
下载量852829

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495