验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [10]

作者

文献类型

期刊论文 [7]

学位论文 [2]

会议论文 [1]

发表日期

2022 [10]

语种

出处

NEUROCOMPU... [2]

IEEE TRANS... [1]

IEEE TRANS... [1]

IEEE Trans... [1]

IEEE-CAA J... [1]

PATTERN RE... [1]

资助项目

National K... [2]

National K... [2]

Beijing Mu... [1]

Chinese Ac... [1]

Key-Area R... [1]

Ministry o... [1]

收录类别

SCI [6]

EI [1]

导师

资助机构

National K... [2]

National N... [2]

Beijing Mu... [1]

Chinese Ac... [1]

Key-Area R... [1]

Ministry o... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共10条，第1-10条

帮助

限定条件	发表日期：2022 专题：多模态人工智能系统全国重点实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Dynamic-horizon model-based value estimation with latent imagination 期刊论文 IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14 作者: Wang JJ(王俊杰); Zhang QC(张启超); Zhao DB(赵冬斌) Adobe PDF(2305Kb) \| 收藏 \| 浏览/下载：197/69 \| 提交时间：2023/05/30 Latent world model model-based value expansion (MVE) reinforcement learning reinforcement learning
	A comprehensive scheme for tattoo text detection 期刊论文 PATTERN RECOGNITION LETTERS, 2022, 卷号: 163, 页码: 168-179 作者: Banerjee, Ayan; Shivakumara, Palaiahnakote; Pal, Umapada; Raghavendra, Ramachandra; Liu, Cheng-Lin 收藏 \| 浏览/下载：177/0 \| 提交时间：2022/11/28
	HMDRL: Hierarchical Mixed Deep Reinforcement Learning to Balance Vehicle Supply and Demand 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2022, 卷号: 23, 期号: 11, 页码: 21861-21872 作者: Xi, Jinhao; Zhu, Fenghua; Ye, Peijun; Lv, Yisheng; Tang, Haina; Wang, Fei-Yue Adobe PDF(3316Kb) \| 收藏 \| 浏览/下载：322/42 \| 提交时间：2022/09/19 deep reinforcement learning online ride-hailing system hierarchical repositioning framework parallel coordination mechanism mixed state
	POPO: Pessimistic Offline Policy Optimization 会议论文 , Singapore, Singapore, 23-27 May 2022 作者: He Q(何强); Hou XW(侯新文); Liu Y(刘禹) Adobe PDF(1200Kb) \| 收藏 \| 浏览/下载：215/44 \| 提交时间：2022/06/27 reinforcement learning offline optimization out-of-distribution
	面向连续控制任务的深度强化学习值函数估计研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强 Adobe PDF(4687Kb) \| 收藏 \| 浏览/下载：233/5 \| 提交时间：2022/06/17 深度强化学习值函数估计值函数表示集成强化学习
	基于元学习和强化学习的机器人操作视觉模仿技术研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李佳怡 Adobe PDF(33715Kb) \| 收藏 \| 浏览/下载：239/15 \| 提交时间：2022/06/13 机器人操作学习视觉模仿元学习强化学习
	Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241 作者: Zhu, Yuanheng; Zhao, Dongbin Adobe PDF(2838Kb) \| 收藏 \| 浏览/下载：252/12 \| 提交时间：2022/06/10 Games Nash equilibrium Mathematical model Markov processes Convergence Dynamic programming Training Deep reinforcement learning (DRL) generalized policy iteration (GPI) Markov game (MG) Nash equilibrium Q network zero sum
	Supervised assisted deep reinforcement learning for emergency voltage control of power systems 期刊论文 NEUROCOMPUTING, 2022, 卷号: 475, 页码: 69-79 作者: Li, Xiaoshuang; Wang, Xiao; Zheng, Xinhu; Dai, Yuxin; Yu, Zhihong; Zhang, Jun Jason; Bu, Guangquan; Wang, Fei-Yue Adobe PDF(2551Kb) \| 收藏 \| 浏览/下载：360/76 \| 提交时间：2022/06/06 Deep reinforcement learning Behavioral cloning Dynamic demonstration Emergency control
	Highway Lane Change Decision-Making via Attention-Based Deep Reinforcement Learning 期刊论文 IEEE-CAA JOURNAL OF AUTOMATICA SINICA, 2022, 卷号: 9, 期号: 3, 页码: 567-569 作者: Wang, Junjie; Zhang, Qichao; Zhao, Dongbin Adobe PDF(803Kb) \| 收藏 \| 浏览/下载：296/69 \| 提交时间：2022/02/16
	SADRL: Merging human experience with machine intelligence via supervised assisted deep reinforcement learning 期刊论文 NEUROCOMPUTING, 2022, 卷号: 467, 页码: 300-309 作者: Li, Xiaoshuang; Wang, Xiao; Zheng, Xinhu; Jin, Junchen; Huang, Yanhao; Zhang, Jun Jason; Wang, Fei-Yue Adobe PDF(1244Kb) \| 收藏 \| 浏览/下载：344/76 \| 提交时间：2021/12/28 Deep reinforcement learning Behavioral cloning Dynamic demonstration Double DQN

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25851
全文量13686
访问量5768196
下载量899358

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495