已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:17/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| Training Large Language Models to Follow System Prompt with Self-Supervised Fine-Tuning 会议论文 , YOKOHAMA, JAPAN, 2024-07 作者: Junyan Qiu ; Haitao Wang ; Yiping Yang![](/image/person.jpg)
Adobe PDF(1596Kb)  |   收藏  |  浏览/下载:40/17  |  提交时间:2024/06/17 large language models supervised fine-tuning instruct tuning stylized generation |
| Health and Senior Care Video Moment Localization With Procedure Knowledge Distillation 会议论文 , Istanbul, Turkiye, Dec 5-8 作者: Chaochen Wu; Meiyun Zuo; Guan Luo ; Yuna Jiang
Adobe PDF(3140Kb)  |   收藏  |  浏览/下载:38/17  |  提交时间:2024/06/05 |
| Factorized Learning Assisted with Large Language Model for Gloss-free Sign Language Translation 会议论文 , Torino, Italia, 2024-5-22 作者: Chen ZG(陈志刚) ; Zhou BJ(周本加); Li J(李俊) ; Wan J(万军) ; Lei Z(雷震) ; Jiang N(江宁); Lu Q(卢泉); Zhao GY(赵国营)
Adobe PDF(800Kb)  |   收藏  |  浏览/下载:49/16  |  提交时间:2024/05/28 |
| 面向无词注释的手语翻译研究 学位论文 , 2024 作者: 陈志刚![](/image/person.jpg)
Adobe PDF(3701Kb)  |   收藏  |  浏览/下载:21/0  |  提交时间:2024/05/28 手语翻译 无词注释 多模态预训练 手语表征学习 |
| 从视频到语言:视频标题生成与描述研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397 作者: 汤鹏杰; 王瀚漓
Adobe PDF(8546Kb)  |   收藏  |  浏览/下载:46/8  |  提交时间:2024/05/20 视频描述 卷积神经网络 循环神经网络 语段生成 情感表达 逻辑语义 |
| Compositional Prompting Video-language Models to Understand Procedure in Instructional Videos 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 249-262 作者: Guyue Hu ; Bin He; Hanwang Zhang
Adobe PDF(2167Kb)  |   收藏  |  浏览/下载:62/26  |  提交时间:2024/04/23 Prompt learning video-language pretrained models instructional videos procedure understanding knowledge distilling |
| Editorial for Special Issue on Large-scale Pre-training: Data, Models, and Fine-tuning 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 145-146 作者: Ji-Rong Wen; Zi Huang; Hanwang Zhang
Adobe PDF(513Kb)  |   收藏  |  浏览/下载:9/5  |  提交时间:2024/04/23 |
| 面向结构化学习的跨模态视频检索研究 学位论文 , 2023 作者: 王威![](/image/person.jpg)
Adobe PDF(14339Kb)  |   收藏  |  浏览/下载:190/11  |  提交时间:2023/06/15 跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习 |
| Learning Video-Text Aligned Representations for Video Captioning 期刊论文 ACM Trans. Multimedia Comput. Commun. Appl., 2023, 页码: 1-21 作者: Yaya Shi; Haiyang Xu; Chunfeng Yuan ; Bing Li ; Weiming Hu,; Zhengjun Zha
Adobe PDF(3574Kb)  |   收藏  |  浏览/下载:227/80  |  提交时间:2023/04/28 |