CASIA OpenIR

浏览/检索结果: 共23条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:17/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
Training Large Language Models to Follow System Prompt with Self-Supervised Fine-Tuning 会议论文
, YOKOHAMA, JAPAN, 2024-07
作者:  Junyan Qiu;  Haitao Wang;  Yiping Yang
Adobe PDF(1596Kb)  |  收藏  |  浏览/下载:40/17  |  提交时间:2024/06/17
large language models  supervised fine-tuning  instruct tuning  stylized generation  
Health and Senior Care Video Moment Localization With Procedure Knowledge Distillation 会议论文
, Istanbul, Turkiye, Dec 5-8
作者:  Chaochen Wu;  Meiyun Zuo;  Guan Luo;  Yuna Jiang
Adobe PDF(3140Kb)  |  收藏  |  浏览/下载:38/17  |  提交时间:2024/06/05
Factorized Learning Assisted with Large Language Model for Gloss-free Sign Language Translation 会议论文
, Torino, Italia, 2024-5-22
作者:  Chen ZG(陈志刚);  Zhou BJ(周本加);  Li J(李俊);  Wan J(万军);  Lei Z(雷震);  Jiang N(江宁);  Lu Q(卢泉);  Zhao GY(赵国营)
Adobe PDF(800Kb)  |  收藏  |  浏览/下载:49/16  |  提交时间:2024/05/28
面向无词注释的手语翻译研究 学位论文
, 2024
作者:  陈志刚
Adobe PDF(3701Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/05/28
手语翻译  无词注释  多模态预训练  手语表征学习  
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:46/8  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
Compositional Prompting Video-language Models to Understand Procedure in Instructional Videos 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 249-262
作者:  Guyue Hu;  Bin He;  Hanwang Zhang
Adobe PDF(2167Kb)  |  收藏  |  浏览/下载:62/26  |  提交时间:2024/04/23
Prompt learning  video-language pretrained models  instructional videos  procedure understanding  knowledge distilling  
Editorial for Special Issue on Large-scale Pre-training: Data, Models, and Fine-tuning 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 145-146
作者:  Ji-Rong Wen;  Zi Huang;  Hanwang Zhang
Adobe PDF(513Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/04/23
面向结构化学习的跨模态视频检索研究 学位论文
, 2023
作者:  王威
Adobe PDF(14339Kb)  |  收藏  |  浏览/下载:190/11  |  提交时间:2023/06/15
跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习  
Learning Video-Text Aligned Representations for Video Captioning 期刊论文
ACM Trans. Multimedia Comput. Commun. Appl., 2023, 页码: 1-21
作者:  Yaya Shi;  Haiyang Xu;  Chunfeng Yuan;  Bing Li;  Weiming Hu,;  Zhengjun Zha
Adobe PDF(3574Kb)  |  收藏  |  浏览/下载:227/80  |  提交时间:2023/04/28