已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:20/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 标注受限的光学遥感图像目标检测模型与算法研究 学位论文 , 2024 作者: 任至达![](/image/person.jpg)
Adobe PDF(18136Kb)  |   收藏  |  浏览/下载:24/1  |  提交时间:2024/07/08 光学遥感图像目标检测 标注受限 弱监督学习 显著性检测 特征增强 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:31/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 几何驱动的三维场景检测与分割 学位论文 , 2024 作者: 关赫![](/image/person.jpg)
Adobe PDF(31711Kb)  |   收藏  |  浏览/下载:33/1  |  提交时间:2024/06/27 几何驱动 单目三维检测 多维场景分割 数据增强 实用性 特征交互 |
| 基于多尺度特征融合的图像语义分割方法研究 学位论文 , 2024 作者: 朱袁兵![](/image/person.jpg)
Adobe PDF(29615Kb)  |   收藏  |  浏览/下载:38/1  |  提交时间:2024/06/27 图像语义分割 实时语义分割 开放词汇语义分割 视觉语言模型 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才![](/image/person.jpg)
Adobe PDF(5844Kb)  |   收藏  |  浏览/下载:38/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |
| 基于脉冲神经网络的多模态视听分类 学位论文 , 2024 作者: 郭凌月![](/image/person.jpg)
Adobe PDF(3051Kb)  |   收藏  |  浏览/下载:26/0  |  提交时间:2024/06/27 脉冲神经网络 多模态对齐 多模态融合 视听分类 |
| 跨模态信息融合的文本图像翻译方法研究 学位论文 , 2024 作者: 马聪
Adobe PDF(11285Kb)  |   收藏  |  浏览/下载:46/5  |  提交时间:2024/06/26 文本图像翻译 跨模态信息融合 多任务学习 跨模态对比学习 参数高效微调 |
| 面向生成语音的模型指纹分析研究 学位论文 , 2024 作者: ZHANG, CHU YUAN![](/image/person.jpg)
Adobe PDF(2152Kb)  |   收藏  |  浏览/下载:25/0  |  提交时间:2024/06/25 生成语音 语音生成方法辨别 声学模型 声码器 模型指纹分析 |
| 面向复杂场景的跨维度视觉感知方法研究 学位论文 , 2024 作者: 潘聪![](/image/person.jpg)
Adobe PDF(28980Kb)  |   收藏  |  浏览/下载:28/0  |  提交时间:2024/06/25 视觉场景感知 二维目标检测 单目三维目标检测 鸟瞰图语义分割 视觉Transformer |