Selected(0)Clear
Items/Page: Sort: |
| 面向结构化学习的跨模态视频检索研究 学位论文 , 2023 Authors: 王威
Adobe PDF(14339Kb)  |   Favorite  |  View/Download:40/2  |  Submit date:2023/06/15 跨模态学习,视频检索,细粒度检索,结构化关系,弱监督学习 |
| 面向情境化语音识别的建模方法研究 学位论文 , 2023 Authors: 韩明伦
Adobe PDF(9191Kb)  |   Favorite  |  View/Download:105/14  |  Submit date:2023/06/19 Automatic Speech Recognition Contextualized Speech Recognition Speech Recognition Customization Multimodal Speech Recognition Continuous Integrate-and-Fire Mechanism |
| 基于自注意力机制的流式端到端语音识别方法研究 学位论文 , 中国 北京: 中国科学院自动化研究所, 2022 Authors: 田正坤
Adobe PDF(8871Kb)  |   Favorite  |  View/Download:172/16  |  Submit date:2022/06/13 请输入关键词 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 Authors: 张子琦
Adobe PDF(19170Kb)  |   Favorite  |  View/Download:1026/7  |  Submit date:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 基于编解码框架的端到端语音识别技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020 Authors: 董林昊
Adobe PDF(5860Kb)  |   Favorite  |  View/Download:299/22  |  Submit date:2020/06/13 语音识别技术 神经网络 编解码框架 端到端建模 |
| 面向数据失配的鲁棒性声学建模方法研究 学位论文 , 中科院自动化研究所: 中国科学院大学, 2020 Authors: 刘斌
Adobe PDF(2027Kb)  |   Favorite  |  View/Download:191/7  |  Submit date:2020/06/09 鲁棒性声学建模 语音识别 对抗学习 语音唤醒 |
| 低资源语言的多语言语音识别建模方法研究 学位论文 , 北京: 中国科学院研究生院, 2018 Authors: 周世玉
Adobe PDF(2353Kb)  |   Favorite  |  View/Download:964/7  |  Submit date:2018/12/20 语音识别 多语言 低资源 跨语言 端到端 多语言语音识别 中 英混合语音识别 Asr Multilingual Low-resource Cross-language Sequence-to-sequence Multilingual Speech Recognition English-mandarin Bilingual Speech Recognition |