已选(0)清除
条数/页: 排序方式: |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1156/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 基于图像与点云的视觉场景语句描述方法研究 学位论文 , 中国科学院大学: 中国科学院大学, 2021 作者: 于强 Adobe PDF(8236Kb)  |  收藏  |  浏览/下载:209/9  |  提交时间:2022/01/14 视觉场景语句描述 属性特征提取 密集点卷积 区域关联 多模态视觉融合 |
| 盲人视觉辅助导航技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 周至公 Adobe PDF(13620Kb)  |  收藏  |  浏览/下载:263/3  |  提交时间:2021/06/24 盲人辅助 视觉导航 语义分割 知识蒸馏 |
| 自然场景文本检测与识别方法研究 学位论文 , 中国科学院大学: 中国科学院大学, 2020 作者: 王聪 Adobe PDF(8251Kb)  |  收藏  |  浏览/下载:242/7  |  提交时间:2020/07/16 场景文本检测,场景文本识别,超像素分割,注意力网络,互指导机制 |
| 基于序列建模的自然场景下文字识别方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 高云泽 Adobe PDF(3939Kb)  |  收藏  |  浏览/下载:365/18  |  提交时间:2020/06/17 场景文字识别,序列建模,全卷积网络,半监督学习,语法关系建模,不规则文字识别 |
| 自然场景文本检测与识别技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 盛芬芬 Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:514/21  |  提交时间:2020/06/12 自然场景图像 文本检测 文本识别 端到端提取 深度学习 |
| 面向盲人视觉辅助眼镜的物体检测算法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2019 作者: 黄佳明 Adobe PDF(2565Kb)  |  收藏  |  浏览/下载:493/5  |  提交时间:2019/06/05 盲人眼镜 卷积神经网络 盲人室外场景数据集 物体检测 特征融合 |
| 知识驱动的多媒体数据特征表示研究 研究报告 2018 作者: 李腾 浏览  |  Adobe PDF(6670Kb)  |  收藏  |  浏览/下载:484/132  |  提交时间:2018/08/30 多媒体计算 深度学习 知识驱动 特征表示 |