CASIA OpenIR

浏览/检索结果: 共3条,第1-3条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
WL-MSR: Watch and Listen for Multimodal Subtitle Recognition 会议论文
, Greece, 2023-6-4
作者:  Liu, Jiawei;  Wang, Hao;  Wang, Weining;  He, Xingjian;  Liu, Jing
Adobe PDF(1673Kb)  |  收藏  |  浏览/下载:181/41  |  提交时间:2023/07/06
文本指导的视频生成方法研究 学位论文
, 2023
作者:  刘佳伟
Adobe PDF(15246Kb)  |  收藏  |  浏览/下载:160/6  |  提交时间:2023/06/08
基于人工智能的内容生成  多模态  视频生成  
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13
作者:  Liu, Jiawei;  Wang, Weining;  Chen, Sihan;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(7741Kb)  |  收藏  |  浏览/下载:168/36  |  提交时间:2023/05/03
Text-guided sounding-video generation  Videoaudio representation  Contrastive learning  Transformer