CASIA OpenIR  > 模式识别国家重点实验室  > 语音交互
基于迁移学习的鲁棒语音识别声学建模方法
易江燕1,2; 陶建华1,2,3; 刘斌1; 温正棋1
2018
发表期刊清华大学学报
卷号58期号:1页码:55-60
其他摘要In order to improve the performance of robust speech recognition under noisy environments, this paper proposes an approach to train acoustic models using transfer learning. This method is that the training of an acoustic model trained with noisy data (student model) is guided by an acoustic model trained with clean data (teacher model). Such training process forces the posterior probability distribution of the student model to be close to the teacher model. Thus it can be achieved by minimizing the Kullback-Leibler (KL) Divergence between the posterior probability distribution of the student model and the teacher model. Experimental results on CHiME-2 dataset show that the proposed method achieves 7.29% absolutely average word error rate (WER) improvement over the baseline and achieves 3.92% absolutely average WER improvement over the best system of CHiME-2.
关键词鲁棒语音识别 声学模型 神经网络 迁移学习
收录类别EI
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/19898
专题模式识别国家重点实验室_语音交互
通讯作者陶建华
作者单位1.中国科学院自动化研究所模式识别国家重点实验室
2.中国科学院大学人工智能技术学院
3.中国科学院自动化研究所中国科学院脑科学与智能技术研究中心
推荐引用方式
GB/T 7714
易江燕,陶建华,刘斌,等. 基于迁移学习的鲁棒语音识别声学建模方法[J]. 清华大学学报,2018,58(1):55-60.
APA 易江燕,陶建华,刘斌,&温正棋.(2018).基于迁移学习的鲁棒语音识别声学建模方法.清华大学学报,58(1),55-60.
MLA 易江燕,et al."基于迁移学习的鲁棒语音识别声学建模方法".清华大学学报 58.1(2018):55-60.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于迁移学习的噪声鲁棒语音识别声学建模.(1412KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[易江燕]的文章
[陶建华]的文章
[刘斌]的文章
百度学术
百度学术中相似的文章
[易江燕]的文章
[陶建华]的文章
[刘斌]的文章
必应学术
必应学术中相似的文章
[易江燕]的文章
[陶建华]的文章
[刘斌]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 基于迁移学习的噪声鲁棒语音识别声学建模.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。