验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [160]

学术期刊 [84]

复杂系统认知与决策... [39]

作者

文献类型

期刊论文 [221]

学位论文 [77]

会议论文 [62]

发表日期

语种

出处

IEEE/CAA ... [60]

IEEE TRAN... [12]

Machine I... [11]

自动化学报 [10]

IEEE TRANS... [7]

IEEE TRANS... [7]

资助项目

National N... [5]

National N... [5]

Strategic ... [4]

Developmen... [3]

National N... [3]

National N... [3]

收录类别

EI [43]

导师

资助机构

National ... [26]

National ... [12]

Early Care... [9]

Beijing Na... [8]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共362条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	自然语言嵌入的深度强化学习探索方法研究学位论文 , 2024 作者: 郭洲蕊 Adobe PDF(7588Kb) \| 收藏 \| 浏览/下载：17/1 \| 提交时间：2024/06/26 深度强化学习自然语言探索
	Adaptive Multi-Agent Coordination among Different Team Attribute Tasks via Contextual Meta-Reinforcement Learning 会议论文 , 河南开封, 2024年5月17-19日作者: Huang, Shangjing; Zhao, Zijie; Zhu, Yuanheng; Zhao, Dongbin Adobe PDF(15515Kb) \| 收藏 \| 浏览/下载：9/4 \| 提交时间：2024/06/26
	Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang; Yang Yiming; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng; Xu Bo Adobe PDF(7948Kb) \| 收藏 \| 浏览/下载：7/4 \| 提交时间：2024/06/25 强化学习，分层强化学习
	Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang; Zhang Hongming; Xing Dengpeng; Bo Xu Adobe PDF(9639Kb) \| 收藏 \| 浏览/下载：7/5 \| 提交时间：2024/06/25
	User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文 , 新加坡, May 13 - 17, 2024 作者: Zhang, Zhiyuan; Zhang, Qichao; Wu, Xiaoxu; Shi, Xiaowen; Liao, Guogang; Wang, Yongkong; Wang, xingxing; Zhao, Dongbin Adobe PDF(2077Kb) \| 收藏 \| 浏览/下载：10/5 \| 提交时间：2024/06/25 Ads Allocation Reinforcement Learning User Response Modeling
	基于用户行为预测和强化学习的推荐策略研究学位论文 , 2024 作者: 张志远 Adobe PDF(3505Kb) \| 收藏 \| 浏览/下载：6/0 \| 提交时间：2024/06/25 强化学习推荐系统用户行为建模
	LEGO: A Multi-agent Collaborative Framework with Role-playing and Iterative Feedback for Causality Explanation Generation 会议论文 , Singapore, 2023-12 作者: Zhitao He; Pengfei Cao; Yubo Chen; Kang Liu; Jun Zhao Adobe PDF(1153Kb) \| 收藏 \| 浏览/下载：2/2 \| 提交时间：2024/06/25
	Enhancing Reinforcement Learning via Transformer-based State Predictive Representations 期刊论文 IEEE Transactions on Artificial Intelligence, 2024, 页码: 1 - 12 作者: Liu MS(刘民颂); Zhu YH(朱圆恒); Chen YR(陈亚冉); Zhao DB(赵冬斌) Adobe PDF(1162Kb) \| 收藏 \| 浏览/下载：13/3 \| 提交时间：2024/06/24
	基于基础模型的分层强化学习学位论文 , 2024 作者: 吴俣桥 Adobe PDF(16716Kb) \| 收藏 \| 浏览/下载：21/0 \| 提交时间：2024/06/21 强化学习分层强化学习基础模型
	Recursive Least-Squares Estimator-Aided Online Learning for Visual Tracking 期刊论文 IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2024, 卷号: 46, 期号: 3, 页码: 1881-1897 作者: Gao, Jin; Lu, Yan; Qi, Xiaojuan; Kou, Yutong; Li, Bing; Li, Liang; Yu, Shan; Hu, Weiming Adobe PDF(915Kb) \| 收藏 \| 浏览/下载：17/5 \| 提交时间：2024/06/21

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25437
全文量13497
访问量5497006
下载量847367

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495