验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系... [119]

学术期刊 [39]

智能感知与计算研究... [28]

紫东太初大模型研究... [22]

复杂系统认知与决策... [19]

作者

文献类型

期刊论文 [141]

学位论文 [98]

会议论文 [72]

研究报告 [1]

发表日期

语种

出处

Machine I... [22]

IEEE TRAN... [13]

IEEE/CAA ... [13]

ACM TRANSA... [4]

IEEE Trans... [4]

Internatio... [4]

资助项目

National N... [9]

National N... [9]

National N... [8]

National N... [6]

National N... [6]

National N... [5]

收录类别

EI [43]

导师

资助机构

National ... [30]

National ... [18]

Beijing Na... [5]

Key Resear... [4]

Natural Sc... [4]

Research P... [4]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共316条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	基于语境辅助转换器的图像标题生成算法期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903 作者: 连政; 王瑞; 李海昌; 姚辉; 胡晓惠 Adobe PDF(3362Kb) \| 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/04/24 图像标题生成注意力机制转换器视觉连贯性
	A Comprehensive Overview of CFN From a Commonsense Perspective 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 2, 页码: 239-256 作者: Ru Li; Yunxiao Zhao; Zhiqiang Wang; Xuefeng Su; Shaoru Guo; Yong Guan; Xiaoqi Han; Hongyan Zhao Adobe PDF(2392Kb) \| 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/04/23 Chinese FrameNet (CFN), commonsense, scenario commonsense, frame, knowledge
	Exploring Variational Auto-encoder Architectures, Configurations, and Datasets for Generative Music Explainable AI 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 29-45 作者: Nick Bryan-Kinns; Bingyuan Zhang; Songyan Zhao; Berker Banar Adobe PDF(1683Kb) \| 收藏 \| 浏览/下载：1/1 \| 提交时间：2024/04/23 Variational auto-encoder, explainable AI (XAI), generative music, musical features, datasets
	How Good is Google Bard's Visual Understanding? An Empirical Study on Open Challenges 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 5, 页码: 605-613 作者: Haotong Qin; Ge-Peng Ji; Salman Khan; Deng-Ping Fan; Fahad Shahbaz Khan; Luc Van Gool Adobe PDF(10373Kb) \| 收藏 \| 浏览/下载：2/0 \| 提交时间：2024/04/23 Google Bard, multi-modal understanding, visual comprehension, large language models, conversational AI, chatbot
	Cross-modal Contrastive Learning for Generalizable and Efficient Image-text Retrieval 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 569-582 作者: Haoyu Lu; Yuqi Huo; Mingyu Ding; Nanyi Fei; Zhiwu Lu Adobe PDF(2928Kb) \| 收藏 \| 浏览/下载：0/0 \| 提交时间：2024/04/23 Image-text retrieval, multimodal modeling, contrastive learning, weak correlation, computer vision
	Transformer: A General Framework from Machine Translation to Others 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538 作者: Yang Zhao; Jiajun Zhang; Chengqing Zong Adobe PDF(1415Kb) \| 收藏 \| 浏览/下载：4/0 \| 提交时间：2024/04/23 Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT
	Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482 作者: Xiao Wang; Guangyao Chen; Guangwu Qian; Pengcheng Gao; Xiao-Yong Wei; Yaowei Wang; Yonghong Tian; Wen Gao Adobe PDF(3540Kb) \| 收藏 \| 浏览/下载：2/0 \| 提交时间：2024/04/23 Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning
	Masked Vision-language Transformer in Fashion 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 421-434 作者: Ge-Peng Ji; Mingchen Zhuge; Dehong Gao; Deng-Ping Fan; Christos Sakaridis; Luc Van Gool Adobe PDF(2779Kb) \| 收藏 \| 浏览/下载：3/2 \| 提交时间：2024/04/23 Vision-language, masked image reconstruction, transformer, fashion, e-commercial
	Vision Enhanced Generative Pre-trained Language Model for Multimodal Sentence Summarization 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 289-298 作者: Liqiang Jing; Yiren Li; Junhao Xu; Yongcan Yu; Pei Shen; Xuemeng Song Adobe PDF(2389Kb) \| 收藏 \| 浏览/下载：4/0 \| 提交时间：2024/04/23 Multimodal sentence summarization (MMSS) generative pre-trained language model (GPLM) natural language generation deep learning artificial intelligence
	Multimodal Pretraining from Monolingual to Multilingual 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 220-232 作者: Liang Zhang; Ludan Ruan; Anwen Hu; Qin Jin Adobe PDF(3024Kb) \| 收藏 \| 浏览/下载：1/0 \| 提交时间：2024/04/23 Multilingual pretraining multimodal pretraining cross-lingual transfer multilingual generation cross-modal retrieval

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24518
全文量12348
访问量5105297
下载量801987

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495