CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

已选(0)清除 条数/页:   排序方式:
Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482
作者:  Xiao Wang;  Guangyao Chen;  Guangwu Qian;  Pengcheng Gao;  Xiao-Yong Wei;  Yaowei Wang;  Yonghong Tian;  Wen Gao
Adobe PDF(3540Kb)  |  收藏  |  浏览/下载:27/5  |  提交时间:2024/04/23
Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning  
Masked Vision-language Transformer in Fashion 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 421-434
作者:  Ge-Peng Ji;  Mingchen Zhuge;  Dehong Gao;  Deng-Ping Fan;  Christos Sakaridis;  Luc Van Gool
Adobe PDF(2779Kb)  |  收藏  |  浏览/下载:11/2  |  提交时间:2024/04/23
Vision-language, masked image reconstruction, transformer, fashion, e-commercial  
Pre-training in Medical Data: A Survey 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 147-149
作者:  Yixuan Qiu;  Feng Lin;  Weitong Chen;  Miao Xu
Adobe PDF(2262Kb)  |  收藏  |  浏览/下载:22/5  |  提交时间:2024/04/23
Medical data  pre-training  transfer learning  self-supervised learning  medical image data  electrocardiograms (ECG) data  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:197/69  |  提交时间:2023/07/06
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1138/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练