CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共3条,第1-3条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Fei-Long Chen;  Du-Zhen Zhang;  Ming-Lun Han;  Xiu-Yi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(1427Kb)  |  收藏  |  浏览/下载:3/2  |  提交时间:2024/04/23
Vision and language  pre-training  transformers  multimodal learning  representation learning  
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:132/28  |  提交时间:2023/06/21
Pyrboxes: An efficient multi-scale scene text detector with feature pyramids 期刊论文
PATTERN RECOGNITION LETTERS, 2019, 卷号: 125, 期号: 2019, 页码: 228-234
作者:  Sheng, Fenfen;  Chen, Zhineng;  Zhang, Wei;  Xu, Bo
浏览  |  Adobe PDF(1558Kb)  |  收藏  |  浏览/下载:315/45  |  提交时间:2019/12/16
Scene text detection  Multi-scale text detection  Grouped pyramid module  Efficient and effective