已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:19/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙![](/image/person.jpg)
Adobe PDF(39126Kb)  |   收藏  |  浏览/下载:26/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 基于多模态协同的驾驶行为预测 学位论文 , 2024 作者: 董清辉![](/image/person.jpg)
Adobe PDF(5017Kb)  |   收藏  |  浏览/下载:20/0  |  提交时间:2024/07/08 人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习 |
| 自然语言嵌入的深度强化学习探索方法研究 学位论文 , 2024 作者: 郭洲蕊![](/image/person.jpg)
Adobe PDF(7588Kb)  |   收藏  |  浏览/下载:33/1  |  提交时间:2024/06/26 深度强化学习 自然语言 探索 |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技![](/image/person.jpg)
Adobe PDF(29796Kb)  |   收藏  |  浏览/下载:62/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥![](/image/person.jpg)
Adobe PDF(16716Kb)  |   收藏  |  浏览/下载:33/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| 组合性感知的弱监督视觉定位研究 学位论文 , 2024 作者: 曾宇楠![](/image/person.jpg)
Adobe PDF(7681Kb)  |   收藏  |  浏览/下载:51/3  |  提交时间:2024/06/04 视觉定位,视觉语言预训练模型,弱监督,组合性 |
| 基于跨膜态分析的图像指代分割算法研究 学位论文 , 2024 作者: 闫熠辰![](/image/person.jpg)
Adobe PDF(5636Kb)  |   收藏  |  浏览/下载:42/3  |  提交时间:2024/06/04 跨模态分析,图像指代分割,视觉语言模型 |
| 非受限场景下文本到图像的生成方法研究 学位论文 , 2024 作者: 孙建新![](/image/person.jpg)
Adobe PDF(32226Kb)  |   收藏  |  浏览/下载:45/3  |  提交时间:2024/06/04 生成式对抗网络,扩散模型,文本到图像生成,人脸图像编辑 |
| 自然场景图像中的文本分割方法研究 学位论文 , 2024 作者: 李天佐![](/image/person.jpg)
Adobe PDF(4674Kb)  |   收藏  |  浏览/下载:28/0  |  提交时间:2024/05/29 文本分割、自适应缩放、自注意力机制、金字塔特征、半监督训练 |