CASIA OpenIR

Browse/Search Results:  1-8 of 8 Help

Selected(0)Clear Items/Page:    Sort:
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张子琦
Adobe PDF(19170Kb)  |  Favorite  |  View/Download:58/4  |  Submit date:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于图像与点云的视觉场景语句描述方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2021
Authors:  于强
Adobe PDF(8236Kb)  |  Favorite  |  View/Download:58/7  |  Submit date:2022/01/14
视觉场景语句描述  属性特征提取  密集点卷积  区域关联  多模态视觉融合  
盲人视觉辅助导航技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  周至公
Adobe PDF(13620Kb)  |  Favorite  |  View/Download:85/2  |  Submit date:2021/06/24
盲人辅助  视觉导航  语义分割  知识蒸馏  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  盛芬芬
Adobe PDF(14633Kb)  |  Favorite  |  View/Download:293/16  |  Submit date:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
自然场景文本检测与识别方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2020
Authors:  王聪
Adobe PDF(8251Kb)  |  Favorite  |  View/Download:132/5  |  Submit date:2020/07/16
场景文本检测,场景文本识别,超像素分割,注意力网络,互指导机制  
基于序列建模的自然场景下文字识别方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  高云泽
Adobe PDF(3939Kb)  |  Favorite  |  View/Download:207/15  |  Submit date:2020/06/17
场景文字识别,序列建模,全卷积网络,半监督学习,语法关系建模,不规则文字识别  
面向盲人视觉辅助眼镜的物体检测算法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  黄佳明
Adobe PDF(2565Kb)  |  Favorite  |  View/Download:354/5  |  Submit date:2019/06/05
盲人眼镜  卷积神经网络  盲人室外场景数据集  物体检测  特征融合  
知识驱动的多媒体数据特征表示研究 研究报告
2018
Authors:  李腾
View  |  Adobe PDF(6670Kb)  |  Favorite  |  View/Download:254/34  |  Submit date:2018/08/30
多媒体计算  深度学习  知识驱动  特征表示