CASIA OpenIR

浏览/检索结果: 共21条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
端到端中英混合语音识别方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学人工智能学院, 2022
作者:  张帅
Adobe PDF(2551Kb)  |  收藏  |  浏览/下载:292/18  |  提交时间:2022/06/17
端到端语音识别  中英混合  语种语音联合建模  多语上下文  语义一致性  
基于语言知识迁移的端到端语音识别方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  白烨
Adobe PDF(7085Kb)  |  收藏  |  浏览/下载:252/12  |  提交时间:2021/06/01
端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别  
个性化语音合成方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2020
作者:  傅睿博
Adobe PDF(3985Kb)  |  收藏  |  浏览/下载:501/17  |  提交时间:2020/06/21
语音合成  个性化定制  声学建模  说话人特征空间建模  韵律建模  
基于迁移学习的小数据语音声学模型研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  易江燕
Adobe PDF(2091Kb)  |  收藏  |  浏览/下载:346/38  |  提交时间:2018/05/31
迁移学习  小语种  口音自适应  声学模型  语音识别  
面向参数语音合成声学建模 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2010
作者:  孙宏军
Adobe PDF(840Kb)  |  收藏  |  浏览/下载:191/2  |  提交时间:2015/09/02
声源激励  谱包络估计  韵律调节  谱平滑  语音参数量化  Source Exciting  Spectrum Envelop Estimation  Prosody Adjust  Spectrum Smooth  Speech Parameters Quantization  
中英文混合语音合成系统 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2009
作者:  张毅
Adobe PDF(510Kb)  |  收藏  |  浏览/下载:350/0  |  提交时间:2015/09/02
英文语音合成  中英文混合  韵律模型  基元选取  English Tts  Chinese–english Mixed Language Tts  Prosody Model  Unit Selection  
基于数据驱动的可视语音合成研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2008
作者:  周密
Adobe PDF(822Kb)  |  收藏  |  浏览/下载:156/0  |  提交时间:2015/09/02
可视语音合成  Mpeg-4  可视韵律  基元选取  Talking Head  Visual Prosody  Mpeg-4  Unit Selection  
嵌入式中英文双语语音合成系统 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2008
作者:  黄力行
Microsoft Word(876Kb)  |  收藏  |  浏览/下载:120/0  |  提交时间:2015/09/02
中英文双语语音合成  嵌入式系统  音库压缩  中英文融合  Bilingual Tts System  Embedded System  Corpus Compression  Combination Of Chinese And English Engine  
真实感人脸建模和动画研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2006
作者:  李永林
Adobe PDF(2198Kb)  |  收藏  |  浏览/下载:151/0  |  提交时间:2015/09/02
个性化真实感人脸建模  真实感人脸动画  可视语音合成  Photo Realistic Facial Modeling  Behavior Realistic Facial Animation  Talkinghead  
嵌入式语音合成系统的研究与实现 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2006
作者:  张皖志
Adobe PDF(700Kb)  |  收藏  |  浏览/下载:172/0  |  提交时间:2015/09/02
语音合成  嵌入式语音合成  音库裁剪  混合基元  聚类  决策树  Text-to-speech  Embedded Tts  Speech Database Pruning  Non-uniform Unit  Clustering  Decision Trees