Knowledge Commons of Institute of Automation,CAS
个性化语音合成中说话人特征不同嵌入方式的研究 | |
汪涛 | |
2019-08 | |
会议名称 | NCMMSC2019 |
会议日期 | 2019 |
会议地点 | 中国青海 |
摘要 | 个性化语音合成是语音合成中一个重要的研究领域。当前语音合成技术以基于端到端的框架为主,本文基于端到端语音合成,结合说话人识别技术提取出特定说话人的特征表示,研究了说话人嵌入至端到端语音合成系统中的不同方式对个性化语音合成的影响。本文结合之前的说话人嵌入方案又提出了两种说话人嵌入方式,通过在 VCTK数据集中训练个性化语音合成系统并比较了三种说话人特征嵌入方式的不同,分析了不同方案合成语音的自然度和相似度,模型参数量的变化以及韵律上表现的效果,最终得出说话人特征嵌入较好的方式。 |
语种 | 中文 |
七大方向——子方向分类 | 智能交互 |
国重实验室规划方向分类 | 语音语言处理 |
是否有论文关联数据集需要存交 | 否 |
文献类型 | 会议论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/52364 |
专题 | 多模态人工智能系统全国重点实验室_模式分析与学习 |
作者单位 | Institute of Automation, Chinese Academy of Sciences |
推荐引用方式 GB/T 7714 | 汪涛. 个性化语音合成中说话人特征不同嵌入方式的研究[C],2019. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
NCMMSC2019_paper_98 (416KB) | 会议论文 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[汪涛]的文章 |
百度学术 |
百度学术中相似的文章 |
[汪涛]的文章 |
必应学术 |
必应学术中相似的文章 |
[汪涛]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论