已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:71/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| 视觉自监督学习关键技术研究 学位论文 , 2024 作者: Li, Zhaowen(李朝闻) Adobe PDF(42567Kb)  |  收藏  |  浏览/下载:62/4  |  提交时间:2024/05/27 请输入关键词 |
| 基于自回归预训练的多语言文本-图像理解方法研究 学位论文 , 2024 作者: 田哲源 Adobe PDF(10331Kb)  |  收藏  |  浏览/下载:45/3  |  提交时间:2024/05/27 多语言模型 文本-图像跨模态理解 自回归预训练 参数微调 |
| 基于多模态学习的视觉神经信息编解码方法研究 学位论文 , 2023 作者: 周琼怡 Adobe PDF(21688Kb)  |  收藏  |  浏览/下载:185/11  |  提交时间:2023/06/23 视觉神经信息编解码 多模态学习 归一化流 多被试语义解码 无监督解耦表征学习 |
| 面向结构化学习的跨模态视频检索研究 学位论文 , 2023 作者: 王威 Adobe PDF(14339Kb)  |  收藏  |  浏览/下载:209/11  |  提交时间:2023/06/15 跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习 |
| 基于关系学习与知识迁移的多媒体内容理解与应用 学位论文 , 2023 作者: 宋亚光 Adobe PDF(11550Kb)  |  收藏  |  浏览/下载:117/5  |  提交时间:2023/06/09 多媒体内容理解 多模态 关系学习 知识迁移 个性化 |
| 多模态感知的对话技术研究 学位论文 , 2023 作者: 陈飞龙 Adobe PDF(34661Kb)  |  收藏  |  浏览/下载:254/17  |  提交时间:2023/06/05 自然语言处理,对话系统,多模态感知,多模态融合,对话推理 |
| 跨模态数据引导的视觉场景分割 学位论文 , 2023 作者: 甘睿彤 Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:171/7  |  提交时间:2023/05/29 视觉场景分割 跨模态数据引导 跨模态特征融合 语义分割 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1177/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |