CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

已选(0)清除 条数/页:   排序方式:
Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482
作者:  Xiao Wang;  Guangyao Chen;  Guangwu Qian;  Pengcheng Gao;  Xiao-Yong Wei;  Yaowei Wang;  Yonghong Tian;  Wen Gao
Adobe PDF(3540Kb)  |  收藏  |  浏览/下载:20/4  |  提交时间:2024/04/23
Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning  
Visual enhanced hierarchical network for sentence-based video thumbnail generation 期刊论文
APPLIED INTELLIGENCE, 2023, 页码: 17
作者:  Wu, Junxian;  Zhang, Yujia;  Zhao, Xiaoguang
收藏  |  浏览/下载:48/0  |  提交时间:2023/11/17
Video thumbnail  DVTG task  Multi-modal fusion  Visual information  Hierarchical multi-layer perceptions  
基于物体识别与信息融合的毒品网页分类研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2014
作者:  胡瑞光
Adobe PDF(4313Kb)  |  收藏  |  浏览/下载:223/0  |  提交时间:2015/09/02
吸毒工具  大麻  显著性驱动非线性扩散滤波  毒品网页  多示例学习  多模态信息融合  Drug-taking Instruments  Cannabis  Saliency Driven Nonlinear Diffusion Filtering  Drug Web Pages  Multi-instance Learning  Multi-modal Information Fusion  
基于多模态关联分析的新闻视频标注与检索 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2012
作者:  张师林
Microsoft Word(11266Kb)  |  收藏  |  浏览/下载:292/0  |  提交时间:2015/09/02
跨媒体  关联分析  视频检索  关键帧  视觉词袋模型  语音识别  文字识别  多模态融合  图模型  命名实体  Cross Media  Association Analysis  Video Retrieval  Key Frame  Bag Of Words Model  Speech Recognition  Optical Character Recognition  Multi-modal Information Fusion  Graph Model  Name Entity