CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

已选(0)清除 条数/页:   排序方式:
文本指导的视频生成方法研究 学位论文
, 2023
作者:  刘佳伟
Adobe PDF(15246Kb)  |  收藏  |  浏览/下载:118/5  |  提交时间:2023/06/08
基于人工智能的内容生成  多模态  视频生成  
跨模态数据引导的视觉场景分割 学位论文
, 2023
作者:  甘睿彤
Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:123/6  |  提交时间:2023/05/29
视觉场景分割  跨模态数据引导  跨模态特征融合  语义分割  
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13
作者:  Liu, Jiawei;  Wang, Weining;  Chen, Sihan;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(7741Kb)  |  收藏  |  浏览/下载:117/20  |  提交时间:2023/05/03
Text-guided sounding-video generation  Videoaudio representation  Contrastive learning  Transformer  
Deep Audio-Visual Learning: A Survey 期刊论文
International Journal of Automation and Computing, 2021, 卷号: 18, 期号: 3, 页码: 351-376
作者:  Hao Zhu;  Man-Di Luo;  Rui Wang;  Ai-Hua Zheng;  Ran He
Adobe PDF(1864Kb)  |  收藏  |  浏览/下载:190/35  |  提交时间:2021/05/24
Deep audio-visual learning  audio-visual separation and localization  correspondence learning  generative models  representation learning