验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [394]

毕业生 [190]

学术期刊 [157]

复杂系统认知与决... [127]

模式识别实验室 [36]

中科院工业视觉智能... [18]

作者

文献类型

期刊论文 [495]

学位论文 [242]

会议论文 [218]

研究报告 [3]

发表日期

语种

出处

IEEE/CAA ... [95]

自动化学报 [31]

IEEE TRAN... [24]

Machine I... [21]

NEUROCOMP... [20]

Internati... [17]

资助项目

National ... [11]

National N... [9]

Strategic ... [8]

National N... [7]

National K... [6]

National K... [6]

收录类别

导师

资助机构

National ... [76]

National ... [25]

Early Car... [18]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共965条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb) \| 收藏 \| 浏览/下载：16/6 \| 提交时间：2024/07/05 reinforcement learning exploration efficiency space reduction
	An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文 , 线上, 2020-5 作者: Liu MS(刘民颂); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(727Kb) \| 收藏 \| 浏览/下载：15/7 \| 提交时间：2024/07/04
	基于强化学习动作空间精简的时序决策任务算法研究学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb) \| 收藏 \| 浏览/下载：30/1 \| 提交时间：2024/07/04 时序决策强化学习动作空间约简分层强化学习动作掩码
	面向多机器人博弈的深度强化学习方法学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb) \| 收藏 \| 浏览/下载：21/0 \| 提交时间：2024/07/04 多智能体深度强化学习多机器人博弈极小极大Q学习值分解最大熵
	基于强化学习的多无人机协同任务规划技术学位论文 , 2024 作者: 张梦瑶 Adobe PDF(2880Kb) \| 收藏 \| 浏览/下载：38/0 \| 提交时间：2024/07/04 多无人机协同作战任务规划图神经网络多旅行商问题强化学习
	Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10 作者: Li, Luntong; Zhu, Yuanheng 收藏 \| 浏览/下载：6/0 \| 提交时间：2024/07/03 Artificial neural networks Vectors Task analysis Training Representation learning Approximation algorithms Optimization Actor-critic deep reinforcement learning (DRL) proximal policy optimization (PPO) shallow reinforcement learning (SRL)
	Modeling and Mitigating the Cycle Aging Cost of Vehicle Batteries in Energy Transportation Nexus 期刊论文 IEEE TRANSACTIONS ON SMART GRID, 2024, 卷号: 15, 期号: 2, 页码: 1902-1912 作者: Li, Shuangqi; Zhao, Pengfei; Gu, Chenghong; Bu, Siqi; Li, Jianwei; Cheng, Shuang 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/07/03 Batteries Aging Degradation Energy management Mathematical models Vehicle-to-grid Computational modeling Electric vehicle battery management hybrid vehicle energy management vehicle grid integration battery aging mechanism priority experience imitative learning
	基于表征学习的离线强化学习方法研究综述期刊论文自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb) \| 收藏 \| 浏览/下载：7/4 \| 提交时间：2024/07/02 强化学习离线强化学习表征学习历史经验数据分布偏移
	动态资讯 2021年第10期（总第90期）其他 2021-10-01 作者: 张桂英 Adobe PDF(5621Kb) \| 收藏 \| 浏览/下载：19/6 \| 提交时间：2024/07/01
	AI资讯 2023年第03期(总第107期) 其他 2023-03-01 作者: 张桂英 Adobe PDF(3134Kb) \| 收藏 \| 浏览/下载：3/2 \| 提交时间：2024/07/01

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25752
全文量13633
访问量5631930
下载量870863

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495