已选(0)清除
条数/页: 排序方式: |
| NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(4719Kb)  |   收藏  |  浏览/下载:20/5  |  提交时间:2024/07/08 |
| Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(5740Kb)  |   收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation 会议论文 Proceedings of the 2024 International Conference on Multimedia Retrieval, Phuket, Thailand, 2024/03/08 作者: Yichen Yan ; Xingjian He ; Sihan Chen; Jing Liu
Adobe PDF(2868Kb)  |   收藏  |  浏览/下载:12/5  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| Correntropy-Induced Wasserstein GCN: Learning Graph Embedding via Domain Adaptation 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2023, 页码: 3980-3993 作者: Wei Wang ; Gaowei Zhang; Hongyong Han; Chi Zhang![](/image/person.jpg)
Adobe PDF(8686Kb)  |   收藏  |  浏览/下载:17/6  |  提交时间:2024/06/27 |
| Humor Detection System for MuSE 2023: Contextual Modeling, Pseudo Labelling, and Post-smoothing 会议论文 , 加拿大多伦多, 2023-11 作者: Xu MY(徐名宇) ; Chen S(陈顺); Lian Z(连政) ; Liu B(刘斌)![](/image/person.jpg)
Adobe PDF(557Kb)  |   收藏  |  浏览/下载:16/8  |  提交时间:2024/06/27 |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:29/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 基于脉冲神经网络的多模态视听分类 学位论文 , 2024 作者: 郭凌月![](/image/person.jpg)
Adobe PDF(3051Kb)  |   收藏  |  浏览/下载:23/0  |  提交时间:2024/06/27 脉冲神经网络 多模态对齐 多模态融合 视听分类 |
| Modal Contrastive Learning Based End-to-End Text Image Machine Translation 期刊论文 IEEE/ACM Transactions on Audio, Speech, and Language Processing (IEEE/ACM TASLP), 2023, 卷号: 32, 期号: 32, 页码: 2153-2165 作者: Ma, Cong ; Han, Xu; Wu, Linghui ; Zhang, Yaping ; Zhao, Yang ; Zhou, Yu ; Zong, Chengqing![](/image/person.jpg)
Adobe PDF(6551Kb)  |   收藏  |  浏览/下载:20/9  |  提交时间:2024/06/26 Transformers Machine translation Decoding Semantics Pipelines Text recognition Task analysis Text image machine translation contrastive learning text image recognition machine translation |
| Neural Parametric Human Hand Modeling with Point Cloud Representation 会议论文 , 泰国普吉岛, 2024-6-11 作者: Yang J(杨健) ; Quan WZ(全卫泽) ; Shen Z(沈震) ; Yan DM(严冬明) ; Wu HY(吴怀宇)![](/image/person.jpg)
Adobe PDF(3109Kb)  |   收藏  |  浏览/下载:24/10  |  提交时间:2024/06/25 |