验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [31]

学术期刊 [15]

紫东太初大模型研究中... [9]

模式识别实验室 [8]

数字内容技术与服务研... [3]

作者

文献类型

期刊论文 [52]

学位论文 [25]

会议论文 [15]

发表日期

语种

出处

Machine In... [8]

IEEE/CAA J... [6]

IEEE TRANS... [4]

ACM TRANSA... [3]

IEEE TRANS... [3]

自动化学报 [3]

资助项目

National N... [3]

National N... [3]

Key Resear... [2]

National N... [2]

National N... [2]

National N... [2]

收录类别

EI [10]

导师

资助机构

National N... [7]

National K... [2]

National K... [2]

Research P... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共92条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	面向视觉-语言的跨模态预训练与匹配方法研究学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb) \| 收藏 \| 浏览/下载：34/2 \| 提交时间：2024/07/11 视觉语言匹配图像文本预训练知识蒸馏双向匹配评估令牌合并
	Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文 IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165 作者: Ma, Cong; Han, Xu; Wu, Linghui; Zhang, Yaping; Zhao, Yang; Zhou, Yu; Zong, Chengqing Adobe PDF(6551Kb) \| 收藏 \| 浏览/下载：43/20 \| 提交时间：2024/06/26 Transformers Machine translation Decoding Semantics Pipelines Text recognition Task analysis Text image machine translation contrastive learning text image recognition machine translation
	基于视觉-语言引导的机器人导航研究学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb) \| 收藏 \| 浏览/下载：71/5 \| 提交时间：2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为
	UniGen: Unified Generative Pre-training for Multilingual Multimodal Representation 会议论文 , Waseda University, Tokyo, Japan, 2024.03.15-2024.03.18 作者: Zheyuan, Tian; Guan, Luo; Bo, Wang; Bing, Li; Weiming, Hu Adobe PDF(975Kb) \| 收藏 \| 浏览/下载：74/19 \| 提交时间：2024/05/31
	DARTScore: DuAl-Reconstruction Transformer for Video Captioning Evaluation 期刊论文 IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2024, 卷号: 34, 期号: 4, 页码: 2041-2055 作者: Chen, Yuxin; Zhang, Ziqi; Qi, Zhongang; Yuan, Chunfeng; Wang, Jie; Shan, Ying; Li, Bing; Hu, Weiming; Qie, Xiaohu; Wu, Jianping Adobe PDF(13765Kb) \| 收藏 \| 浏览/下载：58/5 \| 提交时间：2024/05/30 Chinese video captioning evaluation dual-reconstruction transformer
	视觉自监督学习关键技术研究学位论文 , 2024 作者: Li, Zhaowen（李朝闻） Adobe PDF(42567Kb) \| 收藏 \| 浏览/下载：62/4 \| 提交时间：2024/05/27 请输入关键词
	基于自回归预训练的多语言文本-图像理解方法研究学位论文 , 2024 作者: 田哲源 Adobe PDF(10331Kb) \| 收藏 \| 浏览/下载：45/3 \| 提交时间：2024/05/27 多语言模型文本-图像跨模态理解自回归预训练参数微调
	从视频到语言:视频标题生成与描述研究综述期刊论文自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397 作者: 汤鹏杰; 王瀚漓 Adobe PDF(8546Kb) \| 收藏 \| 浏览/下载：60/14 \| 提交时间：2024/05/20 视频描述卷积神经网络循环神经网络语段生成情感表达逻辑语义
	基于语境辅助转换器的图像标题生成算法期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903 作者: 连政; 王瑞; 李海昌; 姚辉; 胡晓惠 Adobe PDF(3362Kb) \| 收藏 \| 浏览/下载：63/17 \| 提交时间：2024/04/24 图像标题生成注意力机制转换器视觉连贯性
	Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28 作者: Mengting Liu; Ying Zhou; Yuwei Wu; Feng Gao Adobe PDF(14438Kb) \| 收藏 \| 浏览/下载：73/14 \| 提交时间：2024/04/23 Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25867
全文量13705
访问量5890908
下载量928208

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495