CASIA OpenIR

浏览/检索结果: 共12条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
AI资讯 2024年 第01期(总第117期) 其他
2024-01-25
作者:  张桂英
Adobe PDF(3293Kb)  |  收藏  |  浏览/下载:124/42  |  提交时间:2024/01/25
基于平行学习的艺术绘画图像描述算法研究 学位论文
, 2023
作者:  鲁越
Adobe PDF(15730Kb)  |  收藏  |  浏览/下载:112/3  |  提交时间:2023/06/25
平行学习  艺术绘画  图像描述  内容描述  情感描述  
面向结构化学习的跨模态视频检索研究 学位论文
, 2023
作者:  王威
Adobe PDF(14339Kb)  |  收藏  |  浏览/下载:147/10  |  提交时间:2023/06/15
跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李钱钟
Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:269/13  |  提交时间:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解  
基于语义的跨模态检索研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  程文龙
Adobe PDF(3471Kb)  |  收藏  |  浏览/下载:292/16  |  提交时间:2022/06/13
跨模态检索  视觉问答  语音-图像检索  三模态排序损失  循环一致性损失  
AI资讯 2022年第05期(总第97期) 其他
2022-05-30
作者:  王露露
Adobe PDF(6653Kb)  |  收藏  |  浏览/下载:300/79  |  提交时间:2022/05/30
基于深度结构化学习的手写数学公式识别 学位论文
工学博士, 中国科学院自动化所: 中国科学院大学, 2021
作者:  吴金文
Adobe PDF(4312Kb)  |  收藏  |  浏览/下载:237/8  |  提交时间:2022/04/07
手写数学公式识别  配对对抗学习  预感知单元  图到图生成  字符原型  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  郭龙腾
Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:306/20  |  提交时间:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
基于视觉与语言的行人理解 学位论文
, 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021
作者:  荆雅
Adobe PDF(21773Kb)  |  收藏  |  浏览/下载:334/11  |  提交时间:2021/06/21
情境识别  行人检索  行人分割  多模态对齐  关系学习