CASIA OpenIR  > 模式识别国家重点实验室  > 语音交互
基于深度学习语音分离技术的研究现状与进展
刘文举; 聂帅; 梁山
2016
发表期刊自动化学报
卷号42期号:6页码:819-833
摘要现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望.
其他摘要Nowadays, speech interaction technology has been widely used in our daily life. However, due to the interferences, the performances of speech interaction systems in real-world environments are far from being satisfactory. Speech
separation technology has been proven to be an effective way to improve the performance of speech interaction in noisy
environments. To this end, decades of efforts have been devoted to speech separation. There have been many methods
proposed and a lot of success achieved. Especially with the rise of deep learning, deep learning-based speech separation
has been proposed and extensively studied, which has been shown considerable promise and become a main research line.
So far, there have been many deep learning-based speech separation methods proposed. However, there is little systematic
analysis and summary on the deep learning-based speech separation technology. We try to give a detail analysis and
summary on the general procedures and components of speech separation in this regard. Moreover, we survey a wide
range of supervised speech separation techniques from three aspects: 1) features, 2) targets, 3) models. And finally we
give some views on its developments.

 
关键词语音分离 计算听觉场景分析 深度学习
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/19964
专题模式识别国家重点实验室_语音交互
通讯作者刘文举
作者单位中国科学院自动化研究所模式识别国家重点实验室
推荐引用方式
GB/T 7714
刘文举,聂帅,梁山. 基于深度学习语音分离技术的研究现状与进展[J]. 自动化学报,2016,42(6):819-833.
APA 刘文举,聂帅,&梁山.(2016).基于深度学习语音分离技术的研究现状与进展.自动化学报,42(6),819-833.
MLA 刘文举,et al."基于深度学习语音分离技术的研究现状与进展".自动化学报 42.6(2016):819-833.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
刘文举,“基于深度学习语音分离技术的研究(2275KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[刘文举]的文章
[聂帅]的文章
[梁山]的文章
百度学术
百度学术中相似的文章
[刘文举]的文章
[聂帅]的文章
[梁山]的文章
必应学术
必应学术中相似的文章
[刘文举]的文章
[聂帅]的文章
[梁山]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 刘文举,“基于深度学习语音分离技术的研究现状与进展,”.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。