已选(0)清除
条数/页: 排序方式: |
| 面向视觉-语言的跨模态预训练与匹配方法研究 学位论文 , 2024 作者: chen yuxin![](/image/person.jpg)
Adobe PDF(46981Kb)  |   收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11 视觉语言匹配 图像文本预训练 知识蒸馏 双向匹配评估 令牌合并 |
| 跨模态信息融合的文本图像翻译方法研究 学位论文 , 2024 作者: 马聪
Adobe PDF(11285Kb)  |   收藏  |  浏览/下载:38/5  |  提交时间:2024/06/26 文本图像翻译 跨模态信息融合 多任务学习 跨模态对比学习 参数高效微调 |
| 事件类常识知识获取与语言模型知识内化关键技术研究 学位论文 , 2024 作者: 王晨皓![](/image/person.jpg)
Adobe PDF(5599Kb)  |   收藏  |  浏览/下载:45/2  |  提交时间:2024/06/16 常识知识 常识知识获取 语言模型知识萃取 语言模型知识内化 常识问答 |
| 从视频到语言:视频标题生成与描述研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397 作者: 汤鹏杰; 王瀚漓
Adobe PDF(8546Kb)  |   收藏  |  浏览/下载:45/7  |  提交时间:2024/05/20 视频描述 卷积神经网络 循环神经网络 语段生成 情感表达 逻辑语义 |
| 基于改进SAE和双向LSTM的滚动轴承RUL预测方法 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2327-2336 作者: 康守强; 周月; 王玉静; 谢金宝; MIKULOVICHVladimirIvanovich
Adobe PDF(4116Kb)  |   收藏  |  浏览/下载:22/9  |  提交时间:2024/05/20 滚动轴承 稀疏自动编码器 无监督特征提取 双向长短时记忆网络 剩余使用寿命预测 |
| 单目标跟踪中的智能评估技术研究 学位论文 , 2023 作者: 胡世宇![](/image/person.jpg)
Adobe PDF(33423Kb)  |   收藏  |  浏览/下载:142/6  |  提交时间:2024/01/19 单目标跟踪 智能评估技术 视觉跟踪能力 实验环境 评估平台 |
| 标注受限视频人体行为理解模型与算法研究 学位论文 , 2023 作者: 李定![](/image/person.jpg)
Adobe PDF(8391Kb)  |   收藏  |  浏览/下载:168/8  |  提交时间:2023/06/28 标注受限 人体行为理解 主动学习 视频片段检索 自监督学习 |
| 面向第一人称视频的多模态跨域行为识别与预测研究 学位论文 , 2023 作者: 黄毅![](/image/person.jpg)
Adobe PDF(10373Kb)  |   收藏  |  浏览/下载:117/5  |  提交时间:2023/06/21 第一人称视频 行为识别 行为预测 多模态学习 跨域学习 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦![](/image/person.jpg)
Adobe PDF(19170Kb)  |   收藏  |  浏览/下载:1156/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 基于多模态深度对比聚类的自监督视频行为识别研究 学位论文 , 中国科学院自动化所: 中国科学院大学, 2022 作者: 魏久桐![](/image/person.jpg)
Adobe PDF(4465Kb)  |   收藏  |  浏览/下载:243/8  |  提交时间:2022/06/15 自监督学习,多模态内容理解,行为识别,深度聚类 |