CASIA OpenIR

Browse/Search Results:  1-7 of 7 Help

Selected(0)Clear Items/Page:    Sort:
面向结构化学习的跨模态视频检索研究 学位论文
, 2023
Authors:  王威
Adobe PDF(14339Kb)  |  Favorite  |  View/Download:40/2  |  Submit date:2023/06/15
跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习  
面向情境化语音识别的建模方法研究 学位论文
, 2023
Authors:  韩明伦
Adobe PDF(9191Kb)  |  Favorite  |  View/Download:105/14  |  Submit date:2023/06/19
Automatic Speech Recognition  Contextualized Speech Recognition  Speech Recognition Customization  Multimodal Speech Recognition  Continuous Integrate-and-Fire Mechanism  
基于自注意力机制的流式端到端语音识别方法研究 学位论文
, 中国 北京: 中国科学院自动化研究所, 2022
Authors:  田正坤
Adobe PDF(8871Kb)  |  Favorite  |  View/Download:172/16  |  Submit date:2022/06/13
请输入关键词  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张子琦
Adobe PDF(19170Kb)  |  Favorite  |  View/Download:1026/7  |  Submit date:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于编解码框架的端到端语音识别技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  董林昊
Adobe PDF(5860Kb)  |  Favorite  |  View/Download:299/22  |  Submit date:2020/06/13
语音识别技术  神经网络  编解码框架  端到端建模  
面向数据失配的鲁棒性声学建模方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2020
Authors:  刘斌
Adobe PDF(2027Kb)  |  Favorite  |  View/Download:191/7  |  Submit date:2020/06/09
鲁棒性声学建模  语音识别  对抗学习  语音唤醒  
低资源语言的多语言语音识别建模方法研究 学位论文
, 北京: 中国科学院研究生院, 2018
Authors:  周世玉
Adobe PDF(2353Kb)  |  Favorite  |  View/Download:964/7  |  Submit date:2018/12/20
语音识别  多语言  低资源  跨语言  端到端  多语言语音识别  中 英混合语音识别  Asr  Multilingual  Low-resource  Cross-language  Sequence-to-sequence  Multilingual Speech Recognition  English-mandarin Bilingual Speech Recognition