CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
面向多语义和多模态的视觉目标检测研究 学位论文
, 2023
作者:  杨力
Adobe PDF(19168Kb)  |  收藏  |  浏览/下载:155/13  |  提交时间:2023/06/25
目标检测  指代目标检测  多语义  多模态  视觉-语言  
多域伪造特征融合的人像证伪鉴定方法研究 学位论文
, 2023
作者:  王源
Adobe PDF(11307Kb)  |  收藏  |  浏览/下载:124/4  |  提交时间:2023/05/30
三维人脸关键点检测  热力图回归  人脸伪造检测  图卷积神经网络  
面向结构化学习的跨模态视频检索研究 学位论文
, 2023
作者:  王威
Adobe PDF(14339Kb)  |  收藏  |  浏览/下载:141/10  |  提交时间:2023/06/15
跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习  
跨模态数据引导的视觉场景分割 学位论文
, 2023
作者:  甘睿彤
Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:122/6  |  提交时间:2023/05/29
视觉场景分割  跨模态数据引导  跨模态特征融合  语义分割  
面向样本缺失场景的情绪与压力状态评估方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  武金婷
Adobe PDF(7138Kb)  |  收藏  |  浏览/下载:209/8  |  提交时间:2022/09/02
情绪识别  心理压力检测  零样本学习  迁移学习  孪生网络  
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李钱钟
Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:268/13  |  提交时间:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  郭龙腾
Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:305/20  |  提交时间:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
基于注意与记忆机制的视觉描述 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
作者:  王君波
Adobe PDF(6335Kb)  |  收藏  |  浏览/下载:405/2  |  提交时间:2020/01/07
视觉描述  注意与记忆机制  长序列建模  模态相关性  关系学习  
基于多种监督信息的物体识别与检测算法研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  刘敬禹
Adobe PDF(10708Kb)  |  收藏  |  浏览/下载:230/2  |  提交时间:2018/05/31
物体识别  快速物体检测  基于文本描述的物体定位  深度学习