已选(0)清除
条数/页: 排序方式: |
| 会议场景智能语音处理技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 范志赟![](/image/person.jpg)
Adobe PDF(3323Kb)  |   收藏  |  浏览/下载:265/12  |  提交时间:2022/09/15 会议场景,语音识别,说话人转换点检测,说话人自适应 |
| 面向语音翻译的文本规范化和端到端建模方法研究 学位论文 , 中科院自动化所: 中科院自动化所, 2021 作者: 董倩倩![](/image/person.jpg)
Adobe PDF(4379Kb)  |   收藏  |  浏览/下载:297/12  |  提交时间:2021/06/24 语音翻译、级联系统、文本规范化、端到端模型 |
| 自然场景文本检测与识别技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 盛芬芬![](/image/person.jpg)
Adobe PDF(14633Kb)  |   收藏  |  浏览/下载:504/21  |  提交时间:2020/06/12 自然场景图像 文本检测 文本识别 端到端提取 深度学习 |
| 基于多信息融合的端到端语音合成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 邹雨巷![](/image/person.jpg)
Adobe PDF(1954Kb)  |   收藏  |  浏览/下载:308/11  |  提交时间:2020/06/10 语音合成 多信息融合 端到端 |
| 低资源语言的多语言语音识别建模方法研究 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 周世玉![](/image/person.jpg)
Adobe PDF(2353Kb)  |   收藏  |  浏览/下载:1159/8  |  提交时间:2018/12/20 语音识别 多语言 低资源 跨语言 端到端 多语言语音识别 中 英混合语音识别 Asr Multilingual Low-resource Cross-language Sequence-to-sequence Multilingual Speech Recognition English-mandarin Bilingual Speech Recognition |
| 基于循环神经网络的声学建模方法研究 学位论文 , 北京: 中国科学院大学, 2018 作者: 赵媛媛![](/image/person.jpg)
Adobe PDF(4227Kb)  |   收藏  |  浏览/下载:404/11  |  提交时间:2018/06/13 声学建模 循环神经网络 多维残差学习 词打散 改进的低帧率模型 多场景中文语音识别 |
| 面向机器翻译的语言预处理与性能优化 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 汪春奇![](/image/person.jpg)
Adobe PDF(2217Kb)  |   收藏  |  浏览/下载:215/4  |  提交时间:2018/06/08 机器翻译 序列标注 中文分词 半监督学习 半自回归 |
| 语音合成声学建模技术研究 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 王文富![](/image/person.jpg)
Adobe PDF(4177Kb)  |   收藏  |  浏览/下载:428/8  |  提交时间:2018/06/07 语音合成 声学建模 门控循环混合密度网络 卷积输出层 对抗学习 端到端 |
| 基于表示学习的中文短文本对话分析方法研究 学位论文 , 北京: 中国科学院大学, 2017 作者: 周玉军![](/image/person.jpg)
Adobe PDF(2456Kb)  |   收藏  |  浏览/下载:555/8  |  提交时间:2017/12/07 中文短文本对话 深度神经网络 表示学习 词/字向量 注意力机制 |
| 基于深度神经网络的字幕行识别方法研究 学位论文 , 北京: 中国科学院研究生院, 2017 作者: 翟传磊![](/image/person.jpg)
Adobe PDF(6784Kb)  |   收藏  |  浏览/下载:291/2  |  提交时间:2017/06/22 深度神经网络 图像文本行识别 链接时序分类 注意力机制 |