CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共5条,第1-5条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Fei-Long Chen;  Du-Zhen Zhang;  Ming-Lun Han;  Xiu-Yi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(1427Kb)  |  收藏  |  浏览/下载:56/17  |  提交时间:2024/04/23
Vision and language  pre-training  transformers  multimodal learning  representation learning  
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:176/34  |  提交时间:2023/06/21
Exploring wav2vec 2.0 on speaker verification and language identification 会议论文
, 线上会议, 2021-8-30
作者:  Fan ZY(范志赟);  Li M(李蒙);  Zhou SY(周世玉);  Xu B(徐波)
Adobe PDF(2081Kb)  |  收藏  |  浏览/下载:213/44  |  提交时间:2022/09/17
self-supervised  speaker verification  language identification  multi-task learning  wav2vec 2.0  
Consecutive decoding for speech-to-text translation 会议论文
, Virtual, 2021-2
作者:  Dong QQ(董倩倩);  Mingxuan Wang(王明轩);  Hao Zhou(周浩);  Shuang Xu(徐爽);  Bo Xu(徐波);  Lei Li(李磊)
Adobe PDF(586Kb)  |  收藏  |  浏览/下载:240/71  |  提交时间:2021/06/24
Efficient and Accurate Face Shape Reconstruction by Fusion of Multiple Landmark Databases 会议论文
, Taipei, Taiwan, 2019-9-22~2019-9-25
作者:  Wang, Pengrui;  Tian, Yi;  Che, Wujun;  Xu, Bo
浏览  |  Adobe PDF(537Kb)  |  收藏  |  浏览/下载:282/110  |  提交时间:2020/09/11
3D Face Reconstruction  Multi Database Fusion  Face Alignment  Deep Learning