已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| CLIP-Driven hierarchical fusion for referring image segmentation 会议论文 , Kunming, China, 2024/03/08 作者: Yichen Yan; Xingjian He; Jing Liu Adobe PDF(5233Kb)  |  收藏  |  浏览/下载:23/7  |  提交时间:2024/07/08 Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision |
| NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931 作者: Zhang Xi(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(4719Kb)  |  收藏  |  浏览/下载:19/5  |  提交时间:2024/07/08 |
| Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(5740Kb)  |  收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08 |
| VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文 , Canada, 2023 作者: Zhang X(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(1199Kb)  |  收藏  |  浏览/下载:20/5  |  提交时间:2024/07/08 |
| 标注受限的光学遥感图像目标检测模型与算法研究 学位论文 , 2024 作者: 任至达 Adobe PDF(18136Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/07/08 光学遥感图像目标检测 标注受限 弱监督学习 显著性检测 特征增强 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| A Semantic and Structural Transformer for Code Summarization Generation 会议论文 , 澳大利亚, 2023.6.8 作者: Ruyi Ji; Zhenyu Tong; Tiejian Luo; Jing Liu; Libo Zhang Adobe PDF(912Kb)  |  收藏  |  浏览/下载:14/5  |  提交时间:2024/07/08 |
| Sora for Social Vision With Parallel Intelligence: Social Interaction in Intelligent Vehicles 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT VEHICLES, 2024, 卷号: 9, 期号: 3, 页码: 4240-4243 作者: Yu, Hui; Liang, Wei; Fan, Lili; Wang, Yutong; Wang, Fei-Yue 收藏  |  浏览/下载:1/0  |  提交时间:2024/07/03 Intelligent vehicles Computational modeling Transformers Computer vision Visualization Human-vehicle systems Human computer interaction Sora parallel intelligence social vision social interaction intelligent Vehicles diffusion model human-machine interaction |
| SgVA-CLIP: Semantic-Guided Visual Adapting of Vision-Language Models for Few-Shot Image Classification 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 3469-3480 作者: Peng, Fang; Yang, Xiaoshan; Xiao, Linhui; Wang, Yaowei; Xu, Changsheng 收藏  |  浏览/下载:6/0  |  提交时间:2024/07/03 Few-shot image classification vision-language models |