CASIA OpenIR

浏览/检索结果: 共40条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
跨模态信息融合的文本图像翻译方法研究 学位论文
, 2024
作者:  马聪
Adobe PDF(11285Kb)  |  收藏  |  浏览/下载:38/5  |  提交时间:2024/06/26
文本图像翻译  跨模态信息融合  多任务学习  跨模态对比学习  参数高效微调  
事件类常识知识获取与语言模型知识内化关键技术研究 学位论文
, 2024
作者:  王晨皓
Adobe PDF(5599Kb)  |  收藏  |  浏览/下载:45/2  |  提交时间:2024/06/16
常识知识  常识知识获取  语言模型知识萃取  语言模型知识内化  常识问答  
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:45/7  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
基于改进SAE和双向LSTM的滚动轴承RUL预测方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2327-2336
作者:  康守强;  周月;  王玉静;  谢金宝;  MIKULOVICHVladimirIvanovich
Adobe PDF(4116Kb)  |  收藏  |  浏览/下载:22/9  |  提交时间:2024/05/20
滚动轴承  稀疏自动编码器  无监督特征提取  双向长短时记忆网络  剩余使用寿命预测  
单目标跟踪中的智能评估技术研究 学位论文
, 2023
作者:  胡世宇
Adobe PDF(33423Kb)  |  收藏  |  浏览/下载:142/6  |  提交时间:2024/01/19
单目标跟踪  智能评估技术  视觉跟踪能力  实验环境  评估平台  
标注受限视频人体行为理解模型与算法研究 学位论文
, 2023
作者:  李定
Adobe PDF(8391Kb)  |  收藏  |  浏览/下载:168/8  |  提交时间:2023/06/28
标注受限  人体行为理解  主动学习  视频片段检索  自监督学习  
面向第一人称视频的多模态跨域行为识别与预测研究 学位论文
, 2023
作者:  黄毅
Adobe PDF(10373Kb)  |  收藏  |  浏览/下载:117/5  |  提交时间:2023/06/21
第一人称视频  行为识别  行为预测  多模态学习  跨域学习  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1156/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于多模态深度对比聚类的自监督视频行为识别研究 学位论文
, 中国科学院自动化所: 中国科学院大学, 2022
作者:  魏久桐
Adobe PDF(4465Kb)  |  收藏  |  浏览/下载:243/8  |  提交时间:2022/06/15
自监督学习,多模态内容理解,行为识别,深度聚类