基于随机时频掩蔽的 DNN-HMM 声学模型数据扩增
白烨; 易江燕; 陶建华; 温正棋
2019
会议名称全国人机语音通信学术会议
会议日期2019
会议地点青海西宁
摘要

数据扩增(Data Augmentation)是一种通过对数据进行变换来扩展训练数据的方法,可以用以提升深度神经网
络的泛化性能。本文比较了时间弯折、时间掩蔽、频率掩蔽、随机块掩蔽、速度扰动等五种语音数据扩增方法对
DNN-HMM 语音识别系统的影响。本文在公开中文语音数据集 AISHELL-1 上进行了实验。相比于不使用数据扩增的
基线系统,同时采用速度扰动、时间掩蔽、和频率掩蔽的系统可以获得9.4%的相对字错误率下降。

语种中文
七大方向——子方向分类语音识别与合成
文献类型会议论文
条目标识符http://ir.ia.ac.cn/handle/173211/44982
专题多模态人工智能系统全国重点实验室_智能交互
作者单位中国科学院自动化研究所 模式识别国家重点实验室
第一作者单位模式识别国家重点实验室
推荐引用方式
GB/T 7714
白烨,易江燕,陶建华,等. 基于随机时频掩蔽的 DNN-HMM 声学模型数据扩增[C],2019.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
DataAug20190614.pdf(444KB)会议论文 开放获取CC BY-NC-SA浏览
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[白烨]的文章
[易江燕]的文章
[陶建华]的文章
百度学术
百度学术中相似的文章
[白烨]的文章
[易江燕]的文章
[陶建华]的文章
必应学术
必应学术中相似的文章
[白烨]的文章
[易江燕]的文章
[陶建华]的文章
相关权益政策
暂无数据
收藏/分享
文件名: DataAug20190614.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。