CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

  只显示已认领条目
已选(0)清除 条数/页:   排序方式:
WL-MSR: Watch and Listen for Multimodal Subtitle Recognition 会议论文
, Greece, 2023-6-4
作者:  Liu, Jiawei;  Wang, Hao;  Wang, Weining;  He, Xingjian;  Liu, Jing
Adobe PDF(1673Kb)  |  收藏  |  浏览/下载:172/39  |  提交时间:2023/07/06
文本指导的视频生成方法研究 学位论文
, 2023
作者:  刘佳伟
Adobe PDF(15246Kb)  |  收藏  |  浏览/下载:156/6  |  提交时间:2023/06/08
基于人工智能的内容生成  多模态  视频生成  
ED-T2V: An Efficient Training Framework for Diffusion-based Text-to-Video Generation 会议论文
, Queensland, Australia, 2023-6-18
作者:  Liu, Jiawei;  Wang, Weining;  Liu, Wei;  He, Qian;  Liu, Jing
Adobe PDF(4537Kb)  |  收藏  |  浏览/下载:208/44  |  提交时间:2023/05/04
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13
作者:  Liu, Jiawei;  Wang, Weining;  Chen, Sihan;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(7741Kb)  |  收藏  |  浏览/下载:162/32  |  提交时间:2023/05/03
Text-guided sounding-video generation  Videoaudio representation  Contrastive learning  Transformer