基于内容和声学特征层级融合的自动韵律边界标注
傅睿博; 陶建华; 温正棋
发表期刊中国语音学报
2018-10
期号10页码:103-110
文章类型期刊
摘要

韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中不一致、耗时的缺点。仿照人工标注流程,本文对文本特征和声学特征采用层级融合的方式运用循环神经网络训练自动韵律边界标注模型。本文以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明,相比于传统声学特征,本文所采用的静音时长特征使自动韵律标注的性能有所提高;相比于直接特征层面融合和决策层融合的方法,特征层级融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能。

关键词韵律边界标注 特征层级融合 语料库构建 语音合成
收录类别EI
语种中文
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/39601
专题多模态人工智能系统全国重点实验室_智能交互
通讯作者傅睿博
作者单位中国科学院自动化研究所
第一作者单位中国科学院自动化研究所
通讯作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
傅睿博,陶建华,温正棋. 基于内容和声学特征层级融合的自动韵律边界标注[J]. 中国语音学报,2018(10):103-110.
APA 傅睿博,陶建华,&温正棋.(2018).基于内容和声学特征层级融合的自动韵律边界标注.中国语音学报(10),103-110.
MLA 傅睿博,et al."基于内容和声学特征层级融合的自动韵律边界标注".中国语音学报 .10(2018):103-110.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
中国语音学报(期刊).pdf(1209KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[傅睿博]的文章
[陶建华]的文章
[温正棋]的文章
百度学术
百度学术中相似的文章
[傅睿博]的文章
[陶建华]的文章
[温正棋]的文章
必应学术
必应学术中相似的文章
[傅睿博]的文章
[陶建华]的文章
[温正棋]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 中国语音学报(期刊).pdf
格式: Adobe PDF
此文件暂不支持浏览
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。