已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| CLIP-Driven hierarchical fusion for referring image segmentation 会议论文 , Kunming, China, 2024/03/08 作者: Yichen Yan ; Xingjian He ; Jing Liu
Adobe PDF(5233Kb)  |   收藏  |  浏览/下载:23/7  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(4719Kb)  |   收藏  |  浏览/下载:19/5  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation 会议论文 Proceedings of the 2024 International Conference on Multimedia Retrieval, Phuket, Thailand, 2024/03/08 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Jing Liu
Adobe PDF(2868Kb)  |   收藏  |  浏览/下载:12/5  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation 会议论文 , Tianjin, China, 2024/08/05 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Shichen Lu; Jing Liu
Adobe PDF(1978Kb)  |   收藏  |  浏览/下载:11/6  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| 跨模态信息融合的文本图像翻译方法研究 学位论文 , 2024 作者: 马聪
Adobe PDF(11285Kb)  |   收藏  |  浏览/下载:38/5  |  提交时间:2024/06/26 文本图像翻译 跨模态信息融合 多任务学习 跨模态对比学习 参数高效微调 |
| How to Make Cross Encoder a Good Teacher for Efficient Image-Text Retrieval? 会议论文 , 美国西雅图, 2024-6 作者: chen yuxin ; ma zongyang; zhang ziqi ; qi zhongang; yuan chunfeng ; li bing ; pu junfu; shan ying; qi xiaojuan; hu weiming![](/image/person.jpg)
Adobe PDF(1070Kb)  |   收藏  |  浏览/下载:37/10  |  提交时间:2024/06/25 |
| ViLEM: Visual-Language Error Modeling for Image-Text Retrieval 会议论文 , 加拿大温哥华, 2023-6 作者: chen yuxin ; ma zongyang; zhang ziqi ; qi zhongang; yuan chunfeng ; shan ying; li bing ; hu weiming ; qie xiaohu; wu jianping
Adobe PDF(1379Kb)  |   收藏  |  浏览/下载:24/6  |  提交时间:2024/06/25 |
| A Survey of Recent Advances in Commonsense Knowledge Acquisition: Methods and Resources 期刊论文 Machine Intelligence Research, 2024, 页码: 1 作者: Wang, Chenhao ; Li, Jiachun; Chen, Yubo ; Liu, Kang ; Zhao, Jun![](/image/person.jpg)
Adobe PDF(1228Kb)  |   收藏  |  浏览/下载:15/3  |  提交时间:2024/06/25 |