验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [127]

智能感知与计算研究... [49]

紫东太初大模型研究... [37]

学术期刊 [34]

复杂系统认知与决策... [18]

作者

文献类型

期刊论文 [196]

学位论文 [123]

会议论文 [73]

研究报告 [1]

发表日期

语种

出处

PATTERN R... [20]

NEUROCOMP... [18]

Machine I... [16]

IEEE TRAN... [15]

IEEE/CAA ... [11]

IEEE TRANS... [8]

资助项目

National N... [9]

National N... [5]

National N... [4]

National N... [4]

National K... [3]

National N... [3]

收录类别

EI [34]

ACM [1]

导师

资助机构

National ... [25]

National ... [11]

Beijing Na... [6]

National K... [5]

National B... [3]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共395条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	基于语境辅助转换器的图像标题生成算法期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903 作者: 连政; 王瑞; 李海昌; 姚辉; 胡晓惠 Adobe PDF(3362Kb) \| 收藏 \| 浏览/下载：3/1 \| 提交时间：2024/04/24 图像标题生成注意力机制转换器视觉连贯性
	Comprehensive Relation Modelling for Image Paragraph Generation 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 369-382 作者: Xianglu Zhu; Zhang Zhang; Wei Wang; Zilei Wang Adobe PDF(1963Kb) \| 收藏 \| 浏览/下载：4/2 \| 提交时间：2024/04/23 Image paragraph generation, visual relationship, scene graph, graph convolutional network (GCN), long short-term memory
	Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28 作者: Mengting Liu; Ying Zhou; Yuwei Wu; Feng Gao Adobe PDF(14438Kb) \| 收藏 \| 浏览/下载：2/1 \| 提交时间：2024/04/23 Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation
	Cross-modal Contrastive Learning for Generalizable and Efficient Image-text Retrieval 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 569-582 作者: Haoyu Lu; Yuqi Huo; Mingyu Ding; Nanyi Fei; Zhiwu Lu Adobe PDF(2928Kb) \| 收藏 \| 浏览/下载：2/1 \| 提交时间：2024/04/23 Image-text retrieval, multimodal modeling, contrastive learning, weak correlation, computer vision
	Federated Learning on Multimodal Data: A Comprehensive Survey 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 539-553 作者: Yi-Ming Lin; Yuan Gao; Mao-Guo Gong; Si-Jia Zhang; Yuan-Qiao Zhang; Zhi-Yuan Li Adobe PDF(1253Kb) \| 收藏 \| 浏览/下载：5/0 \| 提交时间：2024/04/23 Federated learning, multimodal learning, heterogeneous data, edge computing, collaborative learning
	Transformer: A General Framework from Machine Translation to Others 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538 作者: Yang Zhao; Jiajun Zhang; Chengqing Zong Adobe PDF(1415Kb) \| 收藏 \| 浏览/下载：6/1 \| 提交时间：2024/04/23 Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT
	Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482 作者: Xiao Wang; Guangyao Chen; Guangwu Qian; Pengcheng Gao; Xiao-Yong Wei; Yaowei Wang; Yonghong Tian; Wen Gao Adobe PDF(3540Kb) \| 收藏 \| 浏览/下载：5/0 \| 提交时间：2024/04/23 Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning
	Masked Vision-language Transformer in Fashion 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 421-434 作者: Ge-Peng Ji; Mingchen Zhuge; Dehong Gao; Deng-Ping Fan; Christos Sakaridis; Luc Van Gool Adobe PDF(2779Kb) \| 收藏 \| 浏览/下载：4/2 \| 提交时间：2024/04/23 Vision-language, masked image reconstruction, transformer, fashion, e-commercial
	Compositional Prompting Video-language Models to Understand Procedure in Instructional Videos 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 249-262 作者: Guyue Hu; Bin He; Hanwang Zhang Adobe PDF(2167Kb) \| 收藏 \| 浏览/下载：2/0 \| 提交时间：2024/04/23 Prompt learning video-language pretrained models instructional videos procedure understanding knowledge distilling
	Multimodal Pretraining from Monolingual to Multilingual 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 220-232 作者: Liang Zhang; Ludan Ruan; Anwen Hu; Qin Jin Adobe PDF(3024Kb) \| 收藏 \| 浏览/下载：2/1 \| 提交时间：2024/04/23 Multilingual pretraining multimodal pretraining cross-lingual transfer multilingual generation cross-modal retrieval

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24537
全文量12367
访问量5134064
下载量807182

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495