CASIA OpenIR

Browse/Search Results:  1-9 of 9 Help

Selected(0)Clear Items/Page:    Sort:
AI资讯 2022年第05期(总第97期) 其他
2022-05-30
Authors:  王露露
Adobe PDF(6653Kb)  |  Favorite  |  View/Download:103/21  |  Submit date:2022/05/30
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李钱钟
Adobe PDF(42933Kb)  |  Favorite  |  View/Download:100/7  |  Submit date:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解  
基于语义的跨模态检索研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  程文龙
Adobe PDF(3471Kb)  |  Favorite  |  View/Download:83/8  |  Submit date:2022/06/13
跨模态检索  视觉问答  语音-图像检索  三模态排序损失  循环一致性损失  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张子琦
Adobe PDF(19170Kb)  |  Favorite  |  View/Download:58/4  |  Submit date:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于深度结构化学习的手写数学公式识别 学位论文
工学博士, 中国科学院自动化所: 中国科学院大学, 2021
Authors:  吴金文
Adobe PDF(4312Kb)  |  Favorite  |  View/Download:55/6  |  Submit date:2022/04/07
手写数学公式识别  配对对抗学习  预感知单元  图到图生成  字符原型  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  郭龙腾
Adobe PDF(6291Kb)  |  Favorite  |  View/Download:122/15  |  Submit date:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
基于视觉与语言的行人理解 学位论文
, 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021
Authors:  荆雅
Adobe PDF(21773Kb)  |  Favorite  |  View/Download:95/6  |  Submit date:2021/06/21
情境识别  行人检索  行人分割  多模态对齐  关系学习  
基于特征学习和关系推理的视频行为识别 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2021
Authors:  胡古月
Adobe PDF(17584Kb)  |  Favorite  |  View/Download:145/2  |  Submit date:2021/06/11
视频理解  行为分析  特征学习  关系推理  
基于注意与记忆机制的视觉描述 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
Authors:  王君波
Adobe PDF(6335Kb)  |  Favorite  |  View/Download:277/1  |  Submit date:2020/01/07
视觉描述  注意与记忆机制  长序列建模  模态相关性  关系学习