已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(4719Kb)  |   收藏  |  浏览/下载:19/5  |  提交时间:2024/07/08 |
| Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(5740Kb)  |   收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation 会议论文 Proceedings of the 2024 International Conference on Multimedia Retrieval, Phuket, Thailand, 2024/03/08 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Jing Liu
Adobe PDF(2868Kb)  |   收藏  |  浏览/下载:12/5  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation 会议论文 , Tianjin, China, 2024/08/05 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Shichen Lu; Jing Liu
Adobe PDF(1978Kb)  |   收藏  |  浏览/下载:11/6  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| 多尺度视觉语义增强的多模态命名实体识别方法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1234-1245 作者: 王海荣; 徐玺; 王彤; 陈芳萍
Adobe PDF(2077Kb)  |   收藏  |  浏览/下载:17/7  |  提交时间:2024/07/02 多模态命名实体识别 多任务学习 多模态融合 Transformer |
| AI资讯 2022年 第03期(总第95期) 其他 2022-03-01 作者: 张桂英![](/image/person.jpg)
Adobe PDF(10495Kb)  |   收藏  |  浏览/下载:6/3  |  提交时间:2024/07/01 |
| 基于多尺度特征融合的图像语义分割方法研究 学位论文 , 2024 作者: 朱袁兵![](/image/person.jpg)
Adobe PDF(29615Kb)  |   收藏  |  浏览/下载:29/1  |  提交时间:2024/06/27 图像语义分割 实时语义分割 开放词汇语义分割 视觉语言模型 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才![](/image/person.jpg)
Adobe PDF(5844Kb)  |   收藏  |  浏览/下载:35/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |