验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

学术期刊 [3]

多模态人工智能系统全... [2]

作者

chen yuxi... [2]

文献类型

学位论文 [4]

期刊论文 [4]

会议论文 [1]

发表日期

2024 [9]

语种

出处

IEEE/CAA J... [2]

IEEE TRANS... [1]

Machine In... [1]

资助项目

Beijing Na... [1]

收录类别

EI [1]

SCI [1]

导师

资助机构

Beijing Na... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共9条，第1-9条

帮助

限定条件

发表日期：2024

已选(0)清除条数/页：排序方式：
	面向视觉-语言的跨模态预训练与匹配方法研究学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb) \| 收藏 \| 浏览/下载：35/2 \| 提交时间：2024/07/11 视觉语言匹配图像文本预训练知识蒸馏双向匹配评估令牌合并
	基于视觉-语言引导的机器人导航研究学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb) \| 收藏 \| 浏览/下载：71/5 \| 提交时间：2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为
	UniGen: Unified Generative Pre-training for Multilingual Multimodal Representation 会议论文 , Waseda University, Tokyo, Japan, 2024.03.15-2024.03.18 作者: Zheyuan, Tian; Guan, Luo; Bo, Wang; Bing, Li; Weiming, Hu Adobe PDF(975Kb) \| 收藏 \| 浏览/下载：75/19 \| 提交时间：2024/05/31
	DARTScore: DuAl-Reconstruction Transformer for Video Captioning Evaluation 期刊论文 IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2024, 卷号: 34, 期号: 4, 页码: 2041-2055 作者: Chen, Yuxin; Zhang, Ziqi; Qi, Zhongang; Yuan, Chunfeng; Wang, Jie; Shan, Ying; Li, Bing; Hu, Weiming; Qie, Xiaohu; Wu, Jianping Adobe PDF(13765Kb) \| 收藏 \| 浏览/下载：58/5 \| 提交时间：2024/05/30 Chinese video captioning evaluation dual-reconstruction transformer
	视觉自监督学习关键技术研究学位论文 , 2024 作者: Li, Zhaowen（李朝闻） Adobe PDF(42567Kb) \| 收藏 \| 浏览/下载：62/4 \| 提交时间：2024/05/27 请输入关键词
	基于自回归预训练的多语言文本-图像理解方法研究学位论文 , 2024 作者: 田哲源 Adobe PDF(10331Kb) \| 收藏 \| 浏览/下载：45/3 \| 提交时间：2024/05/27 多语言模型文本-图像跨模态理解自回归预训练参数微调
	Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28 作者: Mengting Liu; Ying Zhou; Yuwei Wu; Feng Gao Adobe PDF(14438Kb) \| 收藏 \| 浏览/下载：73/14 \| 提交时间：2024/04/23 Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation
	Visual Semantic Segmentation Based on Few/Zero-Shot Learning: An Overview 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 5, 页码: 1106-1126 作者: Wenqi Ren; Yang Tang; Qiyu Sun; Chaoqiang Zhao; Qing-Long Han Adobe PDF(12695Kb) \| 收藏 \| 浏览/下载：72/11 \| 提交时间：2024/04/10 Computer vision deep learning few-shot learning low-shot learning semantic segmentation zero-shot learning
	What Does Sora Show: The Beginning of TAO to Imaginative Intelligence and Scenarios Engineering 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 4, 页码: 809-815 作者: Fei-Yue Wang; Qinghai Miao; Lingxi Li; Qinghua Ni; Xuan Li; Juanjuan Li; Lili Fan; Yonglin Tian; Qing-Long Han Adobe PDF(571Kb) \| 收藏 \| 浏览/下载：79/19 \| 提交时间：2024/03/18

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25867
全文量13705
访问量5897637
下载量929645

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495