已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 人脸三维结构恢复和层次化解析 学位论文 , 2024 作者: 于畅![](/image/person.jpg)
Adobe PDF(31650Kb)  |   收藏  |  浏览/下载:21/2  |  提交时间:2024/07/06 人脸层次化解析 三维人脸表征 胶囊网络 可解释表征 |
| 多尺度视觉语义增强的多模态命名实体识别方法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1234-1245 作者: 王海荣; 徐玺; 王彤; 陈芳萍
Adobe PDF(2077Kb)  |   收藏  |  浏览/下载:17/7  |  提交时间:2024/07/02 多模态命名实体识别 多任务学习 多模态融合 Transformer |
| 基于时空共现模式的视觉行人再识别 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 408-417 作者: 钱锦浩; 宋展仁; 郭春超; 赖剑煌; 谢晓华
Adobe PDF(1590Kb)  |   收藏  |  浏览/下载:38/14  |  提交时间:2024/05/20 行人再识别 深度学习 时空共现模式 行人邻域 |
| 从视频到语言:视频标题生成与描述研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397 作者: 汤鹏杰; 王瀚漓
Adobe PDF(8546Kb)  |   收藏  |  浏览/下载:45/7  |  提交时间:2024/05/20 视频描述 卷积神经网络 循环神经网络 语段生成 情感表达 逻辑语义 |
| 仿人灵巧手的功能性抓取学习 学位论文 , 2023 作者: 韦伟![](/image/person.jpg)
Adobe PDF(32678Kb)  |   收藏  |  浏览/下载:176/9  |  提交时间:2024/01/25 机器人学习 仿人灵巧手 功能性抓取 手-物交互 单视角物体重建 |
| 面向第一人称视频的多模态跨域行为识别与预测研究 学位论文 , 2023 作者: 黄毅![](/image/person.jpg)
Adobe PDF(10373Kb)  |   收藏  |  浏览/下载:117/5  |  提交时间:2023/06/21 第一人称视频 行为识别 行为预测 多模态学习 跨域学习 |
| 基于异质图像知识的视觉感知方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 严岚![](/image/person.jpg)
Adobe PDF(13252Kb)  |   收藏  |  浏览/下载:246/11  |  提交时间:2022/06/23 异质图像 计算机视觉 深度学习 生成对抗网络 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦![](/image/person.jpg)
Adobe PDF(19170Kb)  |   收藏  |  浏览/下载:1156/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 基于深层孪生网络的实时目标跟踪研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张志鹏![](/image/person.jpg)
Adobe PDF(12091Kb)  |   收藏  |  浏览/下载:328/10  |  提交时间:2022/06/14 视觉目标跟踪,孪生网络,深层网络,注意力机制,神经架构搜索 |