CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:18/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
基于多尺度特征融合的图像语义分割方法研究 学位论文
, 2024
作者:  朱袁兵
Adobe PDF(29615Kb)  |  收藏  |  浏览/下载:32/1  |  提交时间:2024/06/27
图像语义分割  实时语义分割  开放词汇语义分割  视觉语言模型  
基于视觉-语言引导的机器人导航研究 学位论文
, 2024
作者:  何科技
Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:60/5  |  提交时间:2024/06/25
视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为  
开放集模型自适应方法研究 学位论文
, 2024
作者:  高正清
Adobe PDF(7633Kb)  |  收藏  |  浏览/下载:31/3  |  提交时间:2024/06/04
开放集识别  测试阶段自适应  视觉-语言模型  
组合性感知的弱监督视觉定位研究 学位论文
, 2024
作者:  曾宇楠
Adobe PDF(7681Kb)  |  收藏  |  浏览/下载:51/3  |  提交时间:2024/06/04
视觉定位,视觉语言预训练模型,弱监督,组合性  
基于跨膜态分析的图像指代分割算法研究 学位论文
, 2024
作者:  闫熠辰
Adobe PDF(5636Kb)  |  收藏  |  浏览/下载:42/3  |  提交时间:2024/06/04
跨模态分析,图像指代分割,视觉语言模型  
面向长尾分布的视觉识别关键技术研究 学位论文
, 2024
作者:  李俊
Adobe PDF(9043Kb)  |  收藏  |  浏览/下载:27/3  |  提交时间:2024/06/03
长尾分布  协同学习  视觉语言多模态大模型  高效提示指令微调  
推理机制启发的视觉语言导航 学位论文
, 2024
作者:  安东
Adobe PDF(10930Kb)  |  收藏  |  浏览/下载:93/10  |  提交时间:2024/05/27
视觉语言导航  模块化推理  认知地图  子目标导航  
视觉语言导航研究进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
作者:  司马双霖;  黄岩;  何科技;  安东;  袁辉;  王亮
Adobe PDF(6272Kb)  |  收藏  |  浏览/下载:61/20  |  提交时间:2024/05/09
视觉语言导航  视觉语言理解  跨模态匹配  具身智能  
基于语言−视觉对比学习的多模态视频行为识别方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 2, 页码: 417-430
作者:  张颖;  张冰冰;  董微;  安峰民;  张建新;  张强
Adobe PDF(6014Kb)  |  收藏  |  浏览/下载:63/18  |  提交时间:2024/04/12
视频行为识别  语言-视觉对比学习  多模态模型  时序建模  提示学习