验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [9]

学术期刊 [5]

紫东太初大模型研究中... [3]

模式识别实验室 [3]

智能制造技术与系统研... [1]

作者

chen yuxi... [3]

文献类型

期刊论文 [17]

学位论文 [16]

会议论文 [2]

发表日期

2024 [36]

语种

出处

Machine In... [4]

IEEE TRANS... [3]

Informatio... [2]

CAAI Trans... [1]

Computer V... [1]

IEEE Trans... [1]

资助项目

Beijing Na... [1]

Beijing Na... [1]

CIE-Tencen... [1]

National K... [1]

National K... [1]

National K... [1]

收录类别

EI [2]

导师

资助机构

National N... [5]

Beijing Na... [2]

National K... [2]

CIE-Tencen... [1]

National K... [1]

Prediction... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共36条，第1-10条

帮助

限定条件

发表日期：2024

已选(0)清除条数/页：排序方式：
	Vision Transformers with Hierarchical Attention 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 670-683 作者: Yun Liu; Yu-Huan Wu; Guolei Sun; Le Zhang; Ajad Chhatkuli; Luc Van Gool Adobe PDF(1358Kb) \| 收藏 \| 浏览/下载：16/6 \| 提交时间：2024/07/18 Vision transformer hierarchical attention global attention local attention scene understanding
	面向视觉-语言的跨模态预训练与匹配方法研究学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb) \| 收藏 \| 浏览/下载：22/1 \| 提交时间：2024/07/11 视觉语言匹配图像文本预训练知识蒸馏双向匹配评估令牌合并
	面向多模态语义理解与推理的视觉问答研究学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb) \| 收藏 \| 浏览/下载：34/2 \| 提交时间：2024/07/08 多模态视觉问答语义挖掘可靠关联推理泛化
	Image captioning: Semantic selection unit with stacked residual attention 期刊论文 IMAGE AND VISION COMPUTING, 2024, 卷号: 144, 页码: 12 作者: Song, Lifei; Li, Fei; Wang, Ying; Liu, Yu; Wang, Yuanhua; Xiang, Shiming 收藏 \| 浏览/下载：8/0 \| 提交时间：2024/07/03 Image captioning Semantic attributes Semantic selection unit Transformer Stacked residual attention
	AI资讯 2024年第02期(总第118期) 其他 2024-02-01 作者: 张桂英 Adobe PDF(15035Kb) \| 收藏 \| 浏览/下载：14/7 \| 提交时间：2024/07/01
	基于多尺度特征融合的图像语义分割方法研究学位论文 , 2024 作者: 朱袁兵 Adobe PDF(29615Kb) \| 收藏 \| 浏览/下载：38/1 \| 提交时间：2024/06/27 图像语义分割实时语义分割开放词汇语义分割视觉语言模型
	基于脉冲神经网络的多模态视听分类学位论文 , 2024 作者: 郭凌月 Adobe PDF(3051Kb) \| 收藏 \| 浏览/下载：27/0 \| 提交时间：2024/06/27 脉冲神经网络多模态对齐多模态融合视听分类
	基于强化学习的视觉内容生成学位论文 , 2024 作者: 秦子涵 Adobe PDF(11517Kb) \| 收藏 \| 浏览/下载：32/2 \| 提交时间：2024/06/26 图像生成视频生成强化学习
	Memory-Adaptive Vision-and-Language Navigation 期刊论文 Pattern Recognition, 2024, 卷号: 153, 页码: 110511 作者: Keji He; Ya Jing; Yan Huang; Zhihe Lu; Dong An; Liang Wang Adobe PDF(3831Kb) \| 收藏 \| 浏览/下载：43/17 \| 提交时间：2024/06/26 Vision-and-Language Navigation Memory bank History noises Memory-Adaptive Model
	基于视觉-语言引导的机器人导航研究学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb) \| 收藏 \| 浏览/下载：67/5 \| 提交时间：2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25786
全文量13667
访问量5738396
下载量893853

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495