CASIA OpenIR  > 模式识别国家重点实验室  > 智能交互
多语言语音数据库自动优化方法研究
傅睿博1,2; 陶建华1,2,3; 温正棋1; 易江燕1; 王诗明1,4; 强春雨1,2
2019-08
Conference NameNCMMSC2019
Conference Date2019-8
Conference Place青海西宁
PublisherNCCMSC组委会
Abstract

“文本-音频”数据对的匹配度对端到端语音合成系统有着至关重要的影响。语音数据库的自动优化旨在筛选出出错的文本标注与韵律发音一致性较差的音频,可以克服人工检查中的不一致、耗时的缺点。本文采用半监督学习的方式,利用端到端语音合成模型中的局部敏感注意力机制,在模型训练过程中根据其编码器-解码器对齐信息,运用卷积神经网络来判断每个训练“文本-音频”样本对匹配程度,筛选出待矫正样本对。实验结果表明,本文所提出的语音数据库自动优化方法,精度高于基于语音识别的基线系统,可应用于普通话、英语、粤语、藏语和维吾尔语等不同语言的合成音库,实验还验证了使用自动优化音库训练的端到端合成系统的自然度和鲁棒性均有所提高。

Keyword语音数据库优化 语音合成 多语言 数据对匹配度
MOST Discipline Catalogue工学::控制科学与工程
Indexed By其他
Language中文
Document Type会议论文
Identifierhttp://ir.ia.ac.cn/handle/173211/39592
Collection模式识别国家重点实验室_智能交互
Corresponding Author陶建华
Affiliation1.中国科学院自动化研究所 模式识别国家重点实验室
2.中国科学院大学 人工智能学院
3.中国科学院自动化研究所 中国科学院脑科学与智能技术研究中心
4.中国科学技术大学 信息科学技术学院
First Author AffilicationChinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China
Corresponding Author AffilicationChinese Acad Sci, Inst Automat, Natl Lab Pattern Recognit, Beijing 100190, Peoples R China;  Institute of Automation, Chinese Academy of Sciences
Recommended Citation
GB/T 7714
傅睿博,陶建华,温正棋,等. 多语言语音数据库自动优化方法研究[C]:NCCMSC组委会,2019.
Files in This Item: Download All
File Name/Size DocType Version Access License
4 Research on Automa(542KB)会议论文 开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[傅睿博]'s Articles
[陶建华]'s Articles
[温正棋]'s Articles
Baidu academic
Similar articles in Baidu academic
[傅睿博]'s Articles
[陶建华]'s Articles
[温正棋]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[傅睿博]'s Articles
[陶建华]'s Articles
[温正棋]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 4 Research on Automatic Optimization Method for Multilingual Speech Database furuibo.pdf
Format: Adobe PDF
This file does not support browsing at this time
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.