中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

图片搜索

粘贴图片网址

CASIA OpenIR > 多模态人工智能系统全国重点实验室 > 智能交互

	一种基于卷积神经网络的端到端语音分离方法
	范存航1,3 ; 刘斌1 ; 陶建华1,2,3 ; 温正棋1 ; 易江燕1
发表期刊	信号处理
	2019-04
卷号	35 期号:4 页码:542-548
摘要	大部分的语音分离系统仅仅增强混合的幅值谱（短时傅里叶变换的系数），但是对于相位谱却不做任何处理。然而，最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息，本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征，是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同，本文提出的方法其神经网络只输出一个说话人的信号，其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明，本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training, uPIT)基线方法，对于信号失真比(signal-to-distortion ratio, SDR)相对提高了16.06%。
关键词	说话人独立语音分离鸡尾酒会问题端到端卷积编解码器
语种	中文
七大方向——子方向分类	语音识别与合成
文献类型	期刊论文
条目标识符	http://ir.ia.ac.cn/handle/173211/44395
专题	多模态人工智能系统全国重点实验室_智能交互
通讯作者	陶建华
作者单位	1.中国科学院自动化研究所模式识别国家重点实验室 2.中国科学院脑科学与智能技术卓越创新中心 3.中国科学院大学人工智能学院
第一作者单位	模式识别国家重点实验室
通讯作者单位	模式识别国家重点实验室
推荐引用方式 GB/T 7714	范存航,刘斌,陶建华,等. 一种基于卷积神经网络的端到端语音分离方法[J]. 信号处理,2019,35(4):542-548.
APA	范存航,刘斌,陶建华,温正棋,&易江燕.(2019).一种基于卷积神经网络的端到端语音分离方法.信号处理,35(4),542-548.
MLA	范存航,et al."一种基于卷积神经网络的端到端语音分离方法".信号处理 35.4(2019):542-548.

条目包含的文件		下载所有文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
信号处理-一种基于卷积神经网络的端到端语（1621KB）	期刊论文	作者接受稿	开放获取	CC BY-NC-SA	浏览下载

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[范存航]的文章

[刘斌]的文章

[陶建华]的文章

百度学术

百度学术中相似的文章

[范存航]的文章

[刘斌]的文章

[陶建华]的文章

必应学术

必应学术中相似的文章

[范存航]的文章

[刘斌]的文章

[陶建华]的文章

相关权益政策

收藏/分享

文件名：	信号处理-一种基于卷积神经网络的端到端语音分离方法 (1).pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量25752
全文量13633
访问量5632610
下载量870939