CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
AI资讯 2022年第05期(总第97期) 其他
2022-05-30
作者:  王露露
Adobe PDF(6653Kb)  |  收藏  |  浏览/下载:300/79  |  提交时间:2022/05/30
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李钱钟
Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:269/13  |  提交时间:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解  
基于语义的跨模态检索研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  程文龙
Adobe PDF(3471Kb)  |  收藏  |  浏览/下载:292/16  |  提交时间:2022/06/13
跨模态检索  视觉问答  语音-图像检索  三模态排序损失  循环一致性损失  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练