Knowledge Commons of Institute of Automation,CAS
基于静音时长和文本特征融合的韵律边界自动标注 | |
傅睿博1; 陶建华1![]() ![]() ![]() | |
发表期刊 | 清华大学学报(自然科学版)
![]() |
ISSN | 1000-0054 |
2018-01 | |
卷号 | 58期号:1页码:61-66,74 |
文章类型 | 期刊 |
摘要 | 韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中的不一致、耗时的缺点。仿照人工标注流程,本文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合,从而获得最优标注。本文以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更加具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明,本文所采用的静音时长特征相比于传统声学特征对自动韵律标注的性能有所提高,决策融合方法相比于直接特征层面融合更好地结合了声学和文本的特征,进一步提高了标注的性能。 |
关键词 | 韵律边界标注 决策融合 静音时长 语料库构建 语音合成 |
学科门类 | 工学 ; 工学::控制科学与工程 |
收录类别 | EI |
语种 | 中文 |
资助项目 | National Natural Science Foundation of China (NSFC)[61425017] |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/39309 |
专题 | 多模态人工智能系统全国重点实验室_智能交互 |
通讯作者 | 陶建华 |
作者单位 | 1.中国科学院自动化研究所 模式识别国家重点实验室 2.中国科学院大学 人工智能技术学院 3.中国科学院自动化研究所 中国科学院脑科学与智能技术研究中心 |
第一作者单位 | 模式识别国家重点实验室 |
通讯作者单位 | 模式识别国家重点实验室 |
推荐引用方式 GB/T 7714 | 傅睿博,陶建华,李雅,等. 基于静音时长和文本特征融合的韵律边界自动标注[J]. 清华大学学报(自然科学版),2018,58(1):61-66,74. |
APA | 傅睿博,陶建华,李雅,&温正棋.(2018).基于静音时长和文本特征融合的韵律边界自动标注.清华大学学报(自然科学版),58(1),61-66,74. |
MLA | 傅睿博,et al."基于静音时长和文本特征融合的韵律边界自动标注".清华大学学报(自然科学版) 58.1(2018):61-66,74. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
清华大学学报(期刊).pdf(1160KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[傅睿博]的文章 |
[陶建华]的文章 |
[李雅]的文章 |
百度学术 |
百度学术中相似的文章 |
[傅睿博]的文章 |
[陶建华]的文章 |
[李雅]的文章 |
必应学术 |
必应学术中相似的文章 |
[傅睿博]的文章 |
[陶建华]的文章 |
[李雅]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论