中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

图片搜索

粘贴图片网址

CASIA OpenIR > 多模态人工智能系统全国重点实验室 > 模式分析与学习

	个性化语音合成中说话人特征不同嵌入方式的研究
	汪涛
	2019-08
会议名称	NCMMSC2019
会议日期	2019
会议地点	中国青海
摘要	个性化语音合成是语音合成中一个重要的研究领域。当前语音合成技术以基于端到端的框架为主，本文基于端到端语音合成，结合说话人识别技术提取出特定说话人的特征表示，研究了说话人嵌入至端到端语音合成系统中的不同方式对个性化语音合成的影响。本文结合之前的说话人嵌入方案又提出了两种说话人嵌入方式，通过在 VCTK数据集中训练个性化语音合成系统并比较了三种说话人特征嵌入方式的不同，分析了不同方案合成语音的自然度和相似度，模型参数量的变化以及韵律上表现的效果，最终得出说话人特征嵌入较好的方式。
语种	中文
七大方向——子方向分类	智能交互
国重实验室规划方向分类	语音语言处理
是否有论文关联数据集需要存交	否
文献类型	会议论文
条目标识符	http://ir.ia.ac.cn/handle/173211/52364
专题	多模态人工智能系统全国重点实验室_模式分析与学习
作者单位	Institute of Automation, Chinese Academy of Sciences
推荐引用方式 GB/T 7714	汪涛. 个性化语音合成中说话人特征不同嵌入方式的研究[C],2019.

条目包含的文件		下载所有文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
NCMMSC2019_paper_98 （416KB）	会议论文		开放获取	CC BY-NC-SA	浏览下载

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[汪涛]的文章

百度学术

百度学术中相似的文章

[汪涛]的文章

必应学术

必应学术中相似的文章

[汪涛]的文章

相关权益政策

收藏/分享

文件名：	NCMMSC2019_paper_98 (2).pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量25867
全文量13705
访问量5897610
下载量929636