CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文
, 加拿大温哥华, 2023-6
作者:  chen yuxin;  ma zongyang;  zhang ziqi;  qi zhongang;  yuan chunfeng;  shan ying;  li bing;  hu weiming;  qie xiaohu;  wu jianping
Adobe PDF(1379Kb)  |  收藏  |  浏览/下载:38/10  |  提交时间:2024/06/25
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Fei-Long Chen;  Du-Zhen Zhang;  Ming-Lun Han;  Xiu-Yi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(1427Kb)  |  收藏  |  浏览/下载:62/20  |  提交时间:2024/04/23
Vision and language  pre-training  transformers  multimodal learning  representation learning  
Multi-Correlation Siamese Transformer Network With Dense Connection for 3D Single Object Tracking 期刊论文
IEEE ROBOTICS AND AUTOMATION LETTERS, 2023, 卷号: 8, 期号: 12, 页码: 8066-8073
作者:  Feng, Shihao;  Liang, Pengpeng;  Gao, Jin;  Cheng, Erkang
Adobe PDF(2745Kb)  |  收藏  |  浏览/下载:140/13  |  提交时间:2023/12/21
3D object tracking  Point cloud  Transformer  
Cross-Stream Contrastive Learning for Self-Supervised Skeleton-Based Action Recognition 期刊论文
Image and Vision Computing, 2023, 期号: 135, 页码: 15-26
作者:  Ding Li;  Yongqiang Tang;  Wensheng Zhang
Adobe PDF(2330Kb)  |  收藏  |  浏览/下载:183/50  |  提交时间:2023/06/28
基于多模态学习的视觉神经信息编解码方法研究 学位论文
, 2023
作者:  周琼怡
Adobe PDF(21688Kb)  |  收藏  |  浏览/下载:185/11  |  提交时间:2023/06/23
视觉神经信息编解码  多模态学习  归一化流  多被试语义解码  无监督解耦表征学习  
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:183/37  |  提交时间:2023/06/21