Knowledge Commons of Institute of Automation,CAS
一种基于卷积神经网络的端到端语音分离方法 | |
范存航1,3; 刘斌1; 陶建华1,2,3; 温正棋1; 易江燕1 | |
发表期刊 | 信号处理 |
2019-04 | |
卷号 | 35期号:4页码:542-548 |
摘要 | 大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training, uPIT)基线方法,对于信号失真比(signal-to-distortion ratio, SDR)相对提高了16.06%。 |
关键词 | 说话人独立语音分离 鸡尾酒会问题 端到端 卷积编解码器 |
语种 | 中文 |
七大方向——子方向分类 | 语音识别与合成 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/44395 |
专题 | 多模态人工智能系统全国重点实验室_智能交互 |
通讯作者 | 陶建华 |
作者单位 | 1.中国科学院自动化研究所模式识别国家重点实验室 2.中国科学院脑科学与智能技术卓越创新中心 3.中国科学院大学人工智能学院 |
第一作者单位 | 模式识别国家重点实验室 |
通讯作者单位 | 模式识别国家重点实验室 |
推荐引用方式 GB/T 7714 | 范存航,刘斌,陶建华,等. 一种基于卷积神经网络的端到端语音分离方法[J]. 信号处理,2019,35(4):542-548. |
APA | 范存航,刘斌,陶建华,温正棋,&易江燕.(2019).一种基于卷积神经网络的端到端语音分离方法.信号处理,35(4),542-548. |
MLA | 范存航,et al."一种基于卷积神经网络的端到端语音分离方法".信号处理 35.4(2019):542-548. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
信号处理-一种基于卷积神经网络的端到端语(1621KB) | 期刊论文 | 作者接受稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[范存航]的文章 |
[刘斌]的文章 |
[陶建华]的文章 |
百度学术 |
百度学术中相似的文章 |
[范存航]的文章 |
[刘斌]的文章 |
[陶建华]的文章 |
必应学术 |
必应学术中相似的文章 |
[范存航]的文章 |
[刘斌]的文章 |
[陶建华]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论