CASIA OpenIR

浏览/检索结果: 共3条,第1-3条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
视频中的文本检测与跟踪方法研究 学位论文
, 2023
作者:  张峻博
Adobe PDF(24487Kb)  |  收藏  |  浏览/下载:181/4  |  提交时间:2023/06/25
视频文本检测  文本跟踪  BiRViT-1K  鲁棒特征表示  Transformer  
端到端中英混合语音识别方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学人工智能学院, 2022
作者:  张帅
Adobe PDF(2551Kb)  |  收藏  |  浏览/下载:264/18  |  提交时间:2022/06/17
端到端语音识别  中英混合  语种语音联合建模  多语上下文  语义一致性  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1131/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练