CASIA OpenIR

浏览/检索结果: 共1158条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
NExT-OOD: Overcoming Dual Multiple-Choice VQA Biases 期刊论文
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 页码: 1913-1931
作者:  Zhang Xi(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(4719Kb)  |  收藏  |  浏览/下载:19/5  |  提交时间:2024/07/08
Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文
, Chengdu, China, 2021-10
作者:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(5740Kb)  |  收藏  |  浏览/下载:22/5  |  提交时间:2024/07/08
VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文
, Canada, 2023
作者:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(1199Kb)  |  收藏  |  浏览/下载:20/5  |  提交时间:2024/07/08
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
作者:  张熙
Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
人脸三维结构恢复和层次化解析 学位论文
, 2024
作者:  于畅
Adobe PDF(31650Kb)  |  收藏  |  浏览/下载:21/2  |  提交时间:2024/07/06
人脸层次化解析  三维人脸表征  胶囊网络  可解释表征  
Attribute-Guided Cross-Modal Interaction and Enhancement for Audio-Visual Matching 期刊论文
IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2024, 卷号: 19, 页码: 4986-4998
作者:  Wang, Jiaxiang;  Zheng, Aihua;  Yan, Yan;  He, Ran;  Tang, Jin
收藏  |  浏览/下载:2/0  |  提交时间:2024/07/03
Audio-visual cross-modal matching  attribute-guided cross-modal interaction  attribute-guided cross-modal enhancement  
SASOD: Saliency-Aware Ship Object Detection in High-Resolution Optical Images 期刊论文
IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING, 2024, 卷号: 62, 页码: 15
作者:  Ren, Zhida;  Tang, Yongqiang;  Yang, Yang;  Zhang, Wensheng
Adobe PDF(5807Kb)  |  收藏  |  浏览/下载:10/1  |  提交时间:2024/07/03
ship detection  Saliency detection  high-resolution optical images  remote sensing  Deep learning  Feature extraction  Marine vehicles  Object detection  Remote sensing  Optical sensors  Optical imaging  saliency detection  
Comprehensive Attribute Prediction Learning for Person Search by Language 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 1990-2003
作者:  Niu, Kai;  Huang, Linjiang;  Long, Yuzhou;  Huang, Yan;  Wang, Liang;  Zhang, Yanning
收藏  |  浏览/下载:2/0  |  提交时间:2024/07/03
Person search by language  cross-modal retrieval  smart video surveillance  attribute prediction  
Manual-Label Free 3D Detection via An Open-Source Simulator 会议论文
, Milan, Italy, Jan 10-15, 2021
作者:  Zhen Yang;  Chi Zhang;  Huiming Guo;  Zhaoxiang Zhang
Adobe PDF(4336Kb)  |  收藏  |  浏览/下载:22/8  |  提交时间:2024/06/27