CASIA OpenIR

Browse/Search Results:  1-8 of 8 Help

Selected(0)Clear Items/Page:    Sort:
组合性感知的弱监督视觉定位研究 学位论文
, 2024
Authors:  曾宇楠
Adobe PDF(7681Kb)  |  Favorite  |  View/Download:32/0  |  Submit date:2024/06/04
视觉定位,视觉语言预训练模型,弱监督,组合性  
基于跨膜态分析的图像指代分割算法研究 学位论文
, 2024
Authors:  闫熠辰
Adobe PDF(5636Kb)  |  Favorite  |  View/Download:29/0  |  Submit date:2024/06/04
跨模态分析,图像指代分割,视觉语言模型  
几何图形解析与解题 学位论文
, 2023
Authors:  张明亮
Adobe PDF(6293Kb)  |  Favorite  |  View/Download:102/2  |  Submit date:2024/04/03
几何图形  图例解析  几何解题  定理知识验证  
面向情境化语音识别的建模方法研究 学位论文
, 2023
Authors:  韩明伦
Adobe PDF(9191Kb)  |  Favorite  |  View/Download:217/20  |  Submit date:2023/06/19
Automatic Speech Recognition  Contextualized Speech Recognition  Speech Recognition Customization  Multimodal Speech Recognition  Continuous Integrate-and-Fire Mechanism  
多模态感知的对话技术研究 学位论文
, 2023
Authors:  陈飞龙
Adobe PDF(34661Kb)  |  Favorite  |  View/Download:225/16  |  Submit date:2023/06/05
自然语言处理,对话系统,多模态感知,多模态融合,对话推理  
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  刘飞
Adobe PDF(10058Kb)  |  Favorite  |  View/Download:428/17  |  Submit date:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
面向开放场景行人重识别的特征表示研究 学位论文
, 中科院自动化研究所: 中科院自动化研究所, 2021
Authors:  王贯安
Adobe PDF(21494Kb)  |  Favorite  |  View/Download:215/14  |  Submit date:2022/06/06
开放场景,行人重识别,机器视觉,深度学习  
基于视觉与语言的行人理解 学位论文
, 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021
Authors:  荆雅
Adobe PDF(21773Kb)  |  Favorite  |  View/Download:358/12  |  Submit date:2021/06/21
情境识别  行人检索  行人分割  多模态对齐  关系学习