CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
基于视觉信息表征与融合的图像语义分割研究 学位论文
, 2024
作者:  许镕涛
Adobe PDF(19342Kb)  |  收藏  |  浏览/下载:63/6  |  提交时间:2024/06/24
图像语义分割,表征融合,Transformer, 弱监督学习  
视频中的文本检测与跟踪方法研究 学位论文
, 2023
作者:  张峻博
Adobe PDF(24487Kb)  |  收藏  |  浏览/下载:215/4  |  提交时间:2023/06/25
视频文本检测  文本跟踪  BiRViT-1K  鲁棒特征表示  Transformer  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1172/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
人脸和行人图像属性识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  谭资昌
Adobe PDF(6904Kb)  |  收藏  |  浏览/下载:269/9  |  提交时间:2021/07/01
人脸属性识别  行人属性识别  深度学习  图像识别  
面向交互场景的情感识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  连政
Adobe PDF(4140Kb)  |  收藏  |  浏览/下载:220/15  |  提交时间:2021/06/16
交互场景  情感识别  情感特征提取  多模态融合  个体信息建模  
自然场景文本检测与识别方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2020
作者:  王聪
Adobe PDF(8251Kb)  |  收藏  |  浏览/下载:247/7  |  提交时间:2020/07/16
场景文本检测,场景文本识别,超像素分割,注意力网络,互指导机制