CASIA OpenIR

浏览/检索结果: 共37条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
人脸三维结构恢复和层次化解析 学位论文
, 2024
作者:  于畅
Adobe PDF(31650Kb)  |  收藏  |  浏览/下载:21/2  |  提交时间:2024/07/06
人脸层次化解析  三维人脸表征  胶囊网络  可解释表征  
多尺度视觉语义增强的多模态命名实体识别方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1234-1245
作者:  王海荣;  徐玺;  王彤;  陈芳萍
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/07/02
多模态命名实体识别  多任务学习  多模态融合  Transformer  
基于时空共现模式的视觉行人再识别 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 408-417
作者:  钱锦浩;  宋展仁;  郭春超;  赖剑煌;  谢晓华
Adobe PDF(1590Kb)  |  收藏  |  浏览/下载:38/14  |  提交时间:2024/05/20
行人再识别  深度学习  时空共现模式  行人邻域  
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:45/7  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
仿人灵巧手的功能性抓取学习 学位论文
, 2023
作者:  韦伟
Adobe PDF(32678Kb)  |  收藏  |  浏览/下载:176/9  |  提交时间:2024/01/25
机器人学习  仿人灵巧手  功能性抓取  手-物交互  单视角物体重建  
面向第一人称视频的多模态跨域行为识别与预测研究 学位论文
, 2023
作者:  黄毅
Adobe PDF(10373Kb)  |  收藏  |  浏览/下载:117/5  |  提交时间:2023/06/21
第一人称视频  行为识别  行为预测  多模态学习  跨域学习  
基于异质图像知识的视觉感知方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  严岚
Adobe PDF(13252Kb)  |  收藏  |  浏览/下载:246/11  |  提交时间:2022/06/23
异质图像  计算机视觉  深度学习  生成对抗网络  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1156/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于深层孪生网络的实时目标跟踪研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张志鹏
Adobe PDF(12091Kb)  |  收藏  |  浏览/下载:328/10  |  提交时间:2022/06/14
视觉目标跟踪,孪生网络,深层网络,注意力机制,神经架构搜索