验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [247]

毕业生 [127]

学术期刊 [86]

复杂系统认知与决策... [68]

智能感知与计算研究... [21]

脑图谱与类脑智能实验... [9]

作者

文献类型

期刊论文 [273]

学位论文 [164]

会议论文 [135]

研究报告 [2]

发表日期

语种

出处

IEEE/CAA ... [73]

IEEE TRAN... [21]

NEUROCOMPU... [9]

IEEE TRANS... [8]

IEEE TRANS... [8]

自动化学报 [8]

资助项目

National N... [9]

National N... [8]

National N... [6]

National N... [5]

National N... [5]

National N... [4]

收录类别

EI [77]

导师

资助机构

National ... [51]

National ... [21]

Early Care... [8]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共585条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	A Survey on Recent Advances and Challenges in Reinforcement Learning Methods for Task-oriented Dialogue Policy Learning 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 318-334 作者: Wai-Chung Kwan; Hong-Ru Wang; Hui-Min Wang; Kam-Fai Wong Adobe PDF(2211Kb) \| 收藏 \| 浏览/下载：0/0 \| 提交时间：2024/04/23 Dialogue policy learning (DPL), task-oriented dialogue system (TOD), reinforcement learning (RL), dialogue system, Markov decision process
	Offline Pre-trained Multi-agent Decision Transformer 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 233-248 作者: Linghui Meng; Muning Wen; Chenyang Le; Xiyun Li; Dengpeng Xing; Weinan Zhang; Ying Wen; Haifeng Zhang; Jun Wang; Yaodong Yang; Bo Xu Adobe PDF(2121Kb) \| 收藏 \| 浏览/下载：4/1 \| 提交时间：2024/04/23 Pre-training model multi-agent reinforcement learning (MARL) decision making transformer offline reinforcement learning
	A Dynamic Resource Allocation Strategy with Reinforcement Learning for Multimodal Multi-objective Optimization 期刊论文 Machine Intelligence Research, 2022, 卷号: 19, 期号: 2, 页码: 138-152 作者: Qian-Long Dang; Wei Xu; Yang-Fei Yuan Adobe PDF(2376Kb) \| 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/04/23 Multimodal multi-objective optimization (MMO) dynamic resource allocating strategy (DRAS) reinforcement learning (RL) decision space partition zoning search
	基于自适应动态规划的移动机器人视觉伺服跟踪控制期刊论文自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2286-2296 作者: 罗彪; 欧阳志华; 易昕宁; 刘德荣 Adobe PDF(2335Kb) \| 收藏 \| 浏览/下载：9/4 \| 提交时间：2024/04/18 自适应动态规划移动机器人视觉伺服轨迹跟踪神经网络控制
	异策略深度强化学习中的经验回放研究综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256 作者: 胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny Adobe PDF(4679Kb) \| 收藏 \| 浏览/下载：6/2 \| 提交时间：2024/04/18 深度强化学习异策略经验回放人工智能
	基于滚动时域强化学习的智能车辆侧向控制算法期刊论文自动化学报, 2023, 卷号: 49, 期号: 12, 页码: 2481-2492 作者: 张兴龙; 陆阳; 李文璋; 徐昕 Adobe PDF(7533Kb) \| 收藏 \| 浏览/下载：4/0 \| 提交时间：2024/04/17 滚动时域强化学习智能汽车侧向控制
	基于优先采样模型的离线强化学习期刊论文自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb) \| 收藏 \| 浏览/下载：31/7 \| 提交时间：2024/04/12 离线强化学习优先采样模型时序差分误差鞅批约束深度Q学习
	重大装备制造多机器人任务分配与运动规划技术研究综述期刊论文自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41 作者: 张振国; 毛建旭; 谭浩然; 王耀南; 张雪波; 江一鸣 Adobe PDF(16325Kb) \| 收藏 \| 浏览/下载：7/2 \| 提交时间：2024/04/12 重大装备制造多机器人任务分配运动规划
	基于平行测试的认知自动驾驶智能架构研究期刊论文自动化学报, 2024, 卷号: 50, 期号: 2, 页码: 356-371 作者: 王晓; 张翔宇; 周锐; 田永林; 王建功; 陈龙; 孙长银 Adobe PDF(5843Kb) \| 收藏 \| 浏览/下载：14/6 \| 提交时间：2024/04/12 认知自动驾驶平行测试平行驾驶车辆认知智能
	高超声速变外形飞行器建模与固定时间预设性能控制期刊论文自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 486-504 作者: 曹承钰; 李繁飙; 廖宇新; 殷泽阳; 桂卫华 Adobe PDF(3659Kb) \| 收藏 \| 浏览/下载：11/3 \| 提交时间：2024/04/10 高超声速变外形飞行器固定时间预设性能干扰观测器动态面控制

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24471
全文量12301
访问量5078274
下载量799960

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495