已选(0)清除
条数/页: 排序方式: |
| 面向多语义和多模态的视觉目标检测研究 学位论文 , 2023 作者: 杨力 Adobe PDF(19168Kb)  |  收藏  |  浏览/下载:155/13  |  提交时间:2023/06/25 目标检测 指代目标检测 多语义 多模态 视觉-语言 |
| 多域伪造特征融合的人像证伪鉴定方法研究 学位论文 , 2023 作者: 王源 Adobe PDF(11307Kb)  |  收藏  |  浏览/下载:124/4  |  提交时间:2023/05/30 三维人脸关键点检测 热力图回归 人脸伪造检测 图卷积神经网络 |
| 面向结构化学习的跨模态视频检索研究 学位论文 , 2023 作者: 王威 Adobe PDF(14339Kb)  |  收藏  |  浏览/下载:141/10  |  提交时间:2023/06/15 跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习 |
| 跨模态数据引导的视觉场景分割 学位论文 , 2023 作者: 甘睿彤 Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:122/6  |  提交时间:2023/05/29 视觉场景分割 跨模态数据引导 跨模态特征融合 语义分割 |
| 面向样本缺失场景的情绪与压力状态评估方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 武金婷 Adobe PDF(7138Kb)  |  收藏  |  浏览/下载:209/8  |  提交时间:2022/09/02 情绪识别 心理压力检测 零样本学习 迁移学习 孪生网络 |
| 面向自然人机交互的语言-视觉物体定位方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李钱钟 Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:268/13  |  提交时间:2022/06/13 自然人机交互 零样本物体检测 自然语言-图像指代表达理解 自然语言-视频指代表达理解 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 基于序列生成的图像语义描述 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 郭龙腾 Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:305/20  |  提交时间:2021/06/24 图像语义描述 视觉和语言 序列生成 注意力机制 非自回归解码 |
| 基于注意与记忆机制的视觉描述 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2019 作者: 王君波 Adobe PDF(6335Kb)  |  收藏  |  浏览/下载:405/2  |  提交时间:2020/01/07 视觉描述 注意与记忆机制 长序列建模 模态相关性 关系学习 |
| 基于多种监督信息的物体识别与检测算法研究 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 刘敬禹 Adobe PDF(10708Kb)  |  收藏  |  浏览/下载:230/2  |  提交时间:2018/05/31 物体识别 快速物体检测 基于文本描述的物体定位 深度学习 |