验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [13]

作者

文献类型

期刊论文 [7]

会议论文 [5]

学位论文 [1]

发表日期

语种

出处

ACM TRANSA... [1]

IEEE TRANS... [1]

IEEE TRANS... [1]

IEEE/ACM T... [1]

INTERNATIO... [1]

INTERNATIO... [1]

资助项目

Beijing Na... [1]

Key Resear... [1]

National N... [1]

National N... [1]

National N... [1]

National N... [1]

收录类别

SCI [6]

EI [3]

导师

资助机构

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共13条，第1-10条

帮助

限定条件	专题：多模态人工智能系统全国重点实验室第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文 IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165 作者: Ma, Cong; Han, Xu; Wu, Linghui; Zhang, Yaping; Zhao, Yang; Zhou, Yu; Zong, Chengqing Adobe PDF(6551Kb) \| 收藏 \| 浏览/下载：31/16 \| 提交时间：2024/06/26 Transformers Machine translation Decoding Semantics Pipelines Text recognition Task analysis Text image machine translation contrastive learning text image recognition machine translation
	ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文 , 加拿大温哥华, 2023-6 作者: chen yuxin; ma zongyang; zhang ziqi; qi zhongang; yuan chunfeng; shan ying; li bing; hu weiming; qie xiaohu; wu jianping Adobe PDF(1379Kb) \| 收藏 \| 浏览/下载：32/8 \| 提交时间：2024/06/25
	Learning to Understand Traffic Signs 会议论文 , 四川成都, 2021年10月20日-24日作者: Guo, Yunfei; Feng, Wei; Yin, Fei; Xue, Tao; Mei, Shuqi; Liu, Cheng-Lin Adobe PDF(3271Kb) \| 收藏 \| 浏览/下载：49/21 \| 提交时间：2024/06/13 traffic sign understanding semantic description multi-task learning
	SignParser: An End-to-End Framework for Traffic Sign Understanding 期刊论文 INTERNATIONAL JOURNAL OF COMPUTER VISION, 2023, 卷号: 132, 期号: 2, 页码: 805-821 作者: Guo, Yunfei; Feng, Wei; Yin, Fei; Liu, Cheng-Lin Adobe PDF(7011Kb) \| 收藏 \| 浏览/下载：133/7 \| 提交时间：2023/12/21 Traffic sign understanding Content reasoning Semantic description generation
	ArtCap: A Dataset for Image Captioning of Fine Art Paintings 期刊论文 IEEE TRANSACTIONS ON COMPUTATIONAL SOCIAL SYSTEMS, 2022, 页码: 12 作者: Lu, Yue; Guo, Chao; Dai, Xingyuan; Wang, Fei-Yue Adobe PDF(5137Kb) \| 收藏 \| 浏览/下载：287/54 \| 提交时间：2023/02/22 Dataset construction image captioning painting captioning
	The Model May Fit You: User-Generalized Cross-Modal Retrieval 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2021, 卷号: 24, 页码: 2998-3012 作者: Ma, Xinhong; Yang, Xiaoshan; Gao, Junyu; Xu, Changsheng Adobe PDF(6549Kb) \| 收藏 \| 浏览/下载：289/56 \| 提交时间：2022/06/17 cross-modal retrieval domain generalization meta-learning
	从视频到语言：视频描述和标题生成方法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb) \| 收藏 \| 浏览/下载：1169/15 \| 提交时间：2022/06/16 视觉与语言视频内容描述视频标题生成外部语言模型开卷视频描述中文短视频-文本基准大规模多模态预训练
	A Multi-Task MRC Framework for Chinese Emotion Cause and Experiencer Extraction 会议论文 , Bratislava, Slovakia, 2021-09 作者: Haoda Qian; Qiudan Li; Zaichuan Tang Adobe PDF(79001Kb) \| 收藏 \| 浏览/下载：368/128 \| 提交时间：2022/06/14
	Open-Vocabulary One-Stage Detection with Hierarchical Visual-Language Knowledge Distillation 会议论文 , New Orleans, Louisiana, 2022-06 作者: Zongyang Ma; Guan Luo; Jin Gao; Liang L; Yuxin Chen; Shaoru Wang; Congxuan Zhang; Weiming Hu Adobe PDF(1668Kb) \| 收藏 \| 浏览/下载：300/74 \| 提交时间：2022/04/06
	Fully Convolutional Network Based Skeletonization for Handwritten Chinese Characters 会议论文 , 美国,新奥尔良, 2018-2 作者: Wang TQ(王铁强); Liu CL(刘成林) Adobe PDF(1764Kb) \| 收藏 \| 浏览/下载：201/56 \| 提交时间：2021/06/02

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25833
全文量13668
访问量5750263
下载量896106

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495