已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:18/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 基于多尺度特征融合的图像语义分割方法研究 学位论文 , 2024 作者: 朱袁兵![](/image/person.jpg)
Adobe PDF(29615Kb)  |   收藏  |  浏览/下载:32/1  |  提交时间:2024/06/27 图像语义分割 实时语义分割 开放词汇语义分割 视觉语言模型 |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技![](/image/person.jpg)
Adobe PDF(29796Kb)  |   收藏  |  浏览/下载:60/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| 开放集模型自适应方法研究 学位论文 , 2024 作者: 高正清![](/image/person.jpg)
Adobe PDF(7633Kb)  |   收藏  |  浏览/下载:31/3  |  提交时间:2024/06/04 开放集识别 测试阶段自适应 视觉-语言模型 |
| 组合性感知的弱监督视觉定位研究 学位论文 , 2024 作者: 曾宇楠![](/image/person.jpg)
Adobe PDF(7681Kb)  |   收藏  |  浏览/下载:51/3  |  提交时间:2024/06/04 视觉定位,视觉语言预训练模型,弱监督,组合性 |
| 基于跨膜态分析的图像指代分割算法研究 学位论文 , 2024 作者: 闫熠辰![](/image/person.jpg)
Adobe PDF(5636Kb)  |   收藏  |  浏览/下载:42/3  |  提交时间:2024/06/04 跨模态分析,图像指代分割,视觉语言模型 |
| 面向长尾分布的视觉识别关键技术研究 学位论文 , 2024 作者: 李俊![](/image/person.jpg)
Adobe PDF(9043Kb)  |   收藏  |  浏览/下载:27/3  |  提交时间:2024/06/03 长尾分布 协同学习 视觉语言多模态大模型 高效提示指令微调 |
| 推理机制启发的视觉语言导航 学位论文 , 2024 作者: 安东![](/image/person.jpg)
Adobe PDF(10930Kb)  |   收藏  |  浏览/下载:93/10  |  提交时间:2024/05/27 视觉语言导航 模块化推理 认知地图 子目标导航 |
| 视觉语言导航研究进展 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14 作者: 司马双霖 ; 黄岩 ; 何科技 ; 安东 ; 袁辉; 王亮![](/image/person.jpg)
Adobe PDF(6272Kb)  |   收藏  |  浏览/下载:61/20  |  提交时间:2024/05/09 视觉语言导航 视觉语言理解 跨模态匹配 具身智能 |
| 基于语言−视觉对比学习的多模态视频行为识别方法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 2, 页码: 417-430 作者: 张颖; 张冰冰; 董微; 安峰民; 张建新; 张强
Adobe PDF(6014Kb)  |   收藏  |  浏览/下载:63/18  |  提交时间:2024/04/12 视频行为识别 语言-视觉对比学习 多模态模型 时序建模 提示学习 |