CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于图像与点云的视觉场景语句描述方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2021
作者:  于强
Adobe PDF(8236Kb)  |  收藏  |  浏览/下载:187/9  |  提交时间:2022/01/14
视觉场景语句描述  属性特征提取  密集点卷积  区域关联  多模态视觉融合  
盲人视觉辅助导航技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  周至公
Adobe PDF(13620Kb)  |  收藏  |  浏览/下载:209/3  |  提交时间:2021/06/24
盲人辅助  视觉导航  语义分割  知识蒸馏  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  盛芬芬
Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:478/21  |  提交时间:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
自然场景文本检测与识别方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2020
作者:  王聪
Adobe PDF(8251Kb)  |  收藏  |  浏览/下载:217/7  |  提交时间:2020/07/16
场景文本检测,场景文本识别,超像素分割,注意力网络,互指导机制  
基于序列建模的自然场景下文字识别方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  高云泽
Adobe PDF(3939Kb)  |  收藏  |  浏览/下载:337/18  |  提交时间:2020/06/17
场景文字识别,序列建模,全卷积网络,半监督学习,语法关系建模,不规则文字识别  
面向盲人视觉辅助眼镜的物体检测算法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  黄佳明
Adobe PDF(2565Kb)  |  收藏  |  浏览/下载:459/5  |  提交时间:2019/06/05
盲人眼镜  卷积神经网络  盲人室外场景数据集  物体检测  特征融合