已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:19/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:27/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 人脸三维结构恢复和层次化解析 学位论文 , 2024 作者: 于畅![](/image/person.jpg)
Adobe PDF(31650Kb)  |   收藏  |  浏览/下载:28/2  |  提交时间:2024/07/06 人脸层次化解析 三维人脸表征 胶囊网络 可解释表征 |
| Attribute-Guided Cross-Modal Interaction and Enhancement for Audio-Visual Matching 期刊论文 IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2024, 卷号: 19, 页码: 4986-4998 作者: Wang, Jiaxiang; Zheng, Aihua; Yan, Yan ; He, Ran ; Tang, Jin
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:4/0  |  提交时间:2024/07/03 Audio-visual cross-modal matching attribute-guided cross-modal interaction attribute-guided cross-modal enhancement |
| SASOD: Saliency-Aware Ship Object Detection in High-Resolution Optical Images 期刊论文 IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING, 2024, 卷号: 62, 页码: 15 作者: Ren, Zhida ; Tang, Yongqiang ; Yang, Yang ; Zhang, Wensheng![](/image/person.jpg)
Adobe PDF(5807Kb)  |   收藏  |  浏览/下载:14/2  |  提交时间:2024/07/03 ship detection Saliency detection high-resolution optical images remote sensing Deep learning Feature extraction Marine vehicles Object detection Remote sensing Optical sensors Optical imaging saliency detection |
| Comprehensive Attribute Prediction Learning for Person Search by Language 期刊论文 IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 1990-2003 作者: Niu, Kai ; Huang, Linjiang ; Long, Yuzhou; Huang, Yan ; Wang, Liang ; Zhang, Yanning
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:3/0  |  提交时间:2024/07/03 Person search by language cross-modal retrieval smart video surveillance attribute prediction |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:30/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 基于预训练语言模型的连续文本神经解码方法研究 学位论文 , 2024 作者: 赵心培![](/image/person.jpg)
Adobe PDF(3483Kb)  |   收藏  |  浏览/下载:39/0  |  提交时间:2024/06/27 自然语言处理,神经解码,文本生成,功能磁共振成像 |
| 基于脉冲神经网络的多模态视听分类 学位论文 , 2024 作者: 郭凌月![](/image/person.jpg)
Adobe PDF(3051Kb)  |   收藏  |  浏览/下载:25/0  |  提交时间:2024/06/27 脉冲神经网络 多模态对齐 多模态融合 视听分类 |
| 基于强化学习的视觉内容生成 学位论文 , 2024 作者: 秦子涵![](/image/person.jpg)
Adobe PDF(11517Kb)  |   收藏  |  浏览/下载:31/2  |  提交时间:2024/06/26 图像生成 视频生成 强化学习 |