验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [34]

学术期刊 [6]

模式识别实验室 [4]

复杂系统认知与决策实... [3]

中科院工业视觉智能装... [1]

作者

文献类型

学位论文 [29]

期刊论文 [27]

会议论文 [16]

发表日期

语种

出处

PATTERN RE... [5]

Internatio... [3]

Internatio... [3]

IEEE TRANS... [2]

IEEE/CAA J... [2]

Machine In... [2]

资助项目

Beijing Na... [1]

China Nati... [1]

China Nati... [1]

China Nati... [1]

China Nati... [1]

Major Proj... [1]

收录类别

EI [8]

导师

资助机构

National N... [4]

6141113600... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共72条，第1-10条

帮助

限定条件	专题：中国科学院自动化研究所第一作者的第一单位第一作者单位通讯作者单位

已选(0)清除条数/页：排序方式：
	E2TIMT: Efficient and Effective Modal Adapter for Text Image Machine Translation 会议论文 Proceedings of the 17th Document Analysis and Recognition (ICDAR 2023), San José, California, USA, August 21-26, 2023 作者: Ma, Cong; Zhang, Yaping; Tu, Mei; Zhao, Yang; Zhou, Yu; Zong, Chengqing Adobe PDF(1430Kb) \| 收藏 \| 浏览/下载：19/5 \| 提交时间：2024/06/26
	Multi-teacher Knowledge Distillation for End-to-End Text Image Machine Translation 会议论文 Proceedings of the 17th Document Analysis and Recognition (ICDAR 2023), San José, California, USA, August 21-26, 2023 作者: Ma, Cong; Zhang, Yaping; Tu, Mei; Zhao, Yang; Zhou, Yu; Zong, Chengqing Adobe PDF(1478Kb) \| 收藏 \| 浏览/下载：22/10 \| 提交时间：2024/06/26
	跨模态信息融合的文本图像翻译方法研究学位论文 , 2024 作者: 马聪 Adobe PDF(11285Kb) \| 收藏 \| 浏览/下载：38/5 \| 提交时间：2024/06/26 文本图像翻译跨模态信息融合多任务学习跨模态对比学习参数高效微调
	Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文 IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165 作者: Ma, Cong; Han, Xu; Wu, Linghui; Zhang, Yaping; Zhao, Yang; Zhou, Yu; Zong, Chengqing Adobe PDF(6551Kb) \| 收藏 \| 浏览/下载：20/9 \| 提交时间：2024/06/26 Transformers Machine translation Decoding Semantics Pipelines Text recognition Task analysis Text image machine translation contrastive learning text image recognition machine translation
	CCIM: Cross-modal Cross-lingual Interactive Image Translation 会议论文 Findings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023), Singapore, December 6-10, 2023 作者: Ma, Cong; Zhang, Yaping; Tu, Mei; Zhao, Yang; Zhou, Yu; Zong, Chengqing Adobe PDF(373Kb) \| 收藏 \| 浏览/下载：19/7 \| 提交时间：2024/06/26
	FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation 会议论文 , 加拿大温哥华市, 6.18-6.22 作者: Jie Qin; Jie Wu; Pengxiang Yan; Ming Li; Ren Yuxi; Xuefeng Xiao; Yitong Wang; Rui Wang; Shilei Wen; Xin Pan; Xingang Wang Adobe PDF(5688Kb) \| 收藏 \| 浏览/下载：39/11 \| 提交时间：2024/06/03
	基于脉冲神经网络的语义理解及推理研究学位论文 , 2024 作者: 姜承志 Adobe PDF(6131Kb) \| 收藏 \| 浏览/下载：59/4 \| 提交时间：2024/05/27 脉冲神经网络
	基于自回归预训练的多语言文本-图像理解方法研究学位论文 , 2024 作者: 田哲源 Adobe PDF(10331Kb) \| 收藏 \| 浏览/下载：32/3 \| 提交时间：2024/05/27 多语言模型文本-图像跨模态理解自回归预训练参数微调
	VLP: A Survey on Vision-language Pre-training 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56 作者: Fei-Long Chen; Du-Zhen Zhang; Ming-Lun Han; Xiu-Yi Chen; Jing Shi; Shuang Xu; Bo Xu Adobe PDF(1427Kb) \| 收藏 \| 浏览/下载：44/13 \| 提交时间：2024/04/23 Vision and language pre-training transformers multimodal learning representation learning
	SignParser: An End-to-End Framework for Traffic Sign Understanding 期刊论文 INTERNATIONAL JOURNAL OF COMPUTER VISION, 2023, 卷号: 132, 期号: 2, 页码: 805-821 作者: Guo, Yunfei; Feng, Wei; Yin, Fei; Liu, Cheng-Lin Adobe PDF(7011Kb) \| 收藏 \| 浏览/下载：120/5 \| 提交时间：2023/12/21 Traffic sign understanding Content reasoning Semantic description generation

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25745
全文量13627
访问量5622400
下载量869633

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495