CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1118/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  刘飞
Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:375/17  |  提交时间:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李钱钟
Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:266/13  |  提交时间:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解  
AI资讯 2022年 第01期(总第93期) 其他
2022-01-21
作者:  张桂英
Adobe PDF(9403Kb)  |  收藏  |  浏览/下载:241/60  |  提交时间:2022/01/21