Knowledge Commons of Institute of Automation,CAS
基于i向量和变分自编码相对生成对抗网络的语音转换 | |
李燕萍; 曹盼; 左宇涛; 张燕; 钱博 | |
发表期刊 | 自动化学报
![]() |
ISSN | 0254-4156 |
2022 | |
卷号 | 48期号:7页码:1824-1833 |
摘要 | 提出一种基于i向量和变分自编码相对生成对抗网络的语音转换方法,实现了非平行文本条件下高质量的多对多语音转换.性能良好的语音转换系统,既要保持重构语音的自然度,又要兼顾转换语音的说话人个性特征是否准确.首先为了改善合成语音自然度,利用生成性能更好的相对生成对抗网络代替基于变分自编码生成对抗网络模型中的Wasserstein生成对抗网络,通过构造相对鉴别器的方式,使得鉴别器的输出依赖于真实样本和生成样本间的相对值,克服了Wasserstein生成对抗网络性能不稳定和收敛速度较慢等问题.进一步为了提升转换语音的说话人个性相似度,在解码阶段,引入含有丰富个性信息的i向量,以充分学习说话人的个性化特征.客观和主观实验表明,转换后的语音平均梅尔倒谱失真距离值较基准模型降低4.80%,平均意见得分值提升5.12%, ABX值提升8.60%,验证了该方法在语音自然度和个性相似度两个方面均有显著的提高,实现了高质量的语音转换. |
关键词 | 语音转换 相对生成对抗网络 i向量 非平行文本 变分自编码器 多对多 |
DOI | 10.16383/j.aas.c190733 |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/56329 |
专题 | 学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 李燕萍,曹盼,左宇涛,等. 基于i向量和变分自编码相对生成对抗网络的语音转换[J]. 自动化学报,2022,48(7):1824-1833. |
APA | 李燕萍,曹盼,左宇涛,张燕,&钱博.(2022).基于i向量和变分自编码相对生成对抗网络的语音转换.自动化学报,48(7),1824-1833. |
MLA | 李燕萍,et al."基于i向量和变分自编码相对生成对抗网络的语音转换".自动化学报 48.7(2022):1824-1833. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
AAS-CN-2019-0733.pdf(5653KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[李燕萍]的文章 |
[曹盼]的文章 |
[左宇涛]的文章 |
百度学术 |
百度学术中相似的文章 |
[李燕萍]的文章 |
[曹盼]的文章 |
[左宇涛]的文章 |
必应学术 |
必应学术中相似的文章 |
[李燕萍]的文章 |
[曹盼]的文章 |
[左宇涛]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论