CASIA OpenIR  > 学术期刊  > 自动化学报
基于RefineNet的端到端语音增强方法
蓝天; 彭川; 李森; 钱宇欣; 陈聪; 刘峤
发表期刊自动化学报
ISSN0254-4156
2022
卷号48期号:2页码:554-563
摘要为提高神经网络对语音信号时域波形的直接处理能力,提出了一种基于RefineNet的端到端语音增强方法.本文构建了一个时频分析神经网络,模拟语音信号处理中的短时傅里叶变换,利用RefineNet网络学习含噪语音到纯净语音的特征映射.在模型训练阶段,用多目标联合优化的训练策略将语音增强的评价指标短时客观可懂度(Short-time objective intelligibility, STOI)与信源失真比(Source to distortion ratio, SDR)融入到训练的损失函数.在与具有代表性的传统方法和端到端的深度学习方法的对比实验中,本文提出的算法在客观评价指标上均取得了最好的增强效果,并且在未知噪声和低信噪比条件下表现出更好的抗噪性.
关键词语音增强 端到端 RefineNet 多目标联合优化 深度神经网络
DOI10.16383/j.aas.c190433
引用统计
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/56420
专题学术期刊_自动化学报
推荐引用方式
GB/T 7714
蓝天,彭川,李森,等. 基于RefineNet的端到端语音增强方法[J]. 自动化学报,2022,48(2):554-563.
APA 蓝天,彭川,李森,钱宇欣,陈聪,&刘峤.(2022).基于RefineNet的端到端语音增强方法.自动化学报,48(2),554-563.
MLA 蓝天,et al."基于RefineNet的端到端语音增强方法".自动化学报 48.2(2022):554-563.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
AAS-CN-2019-0433.pdf(21378KB)期刊论文出版稿开放获取CC BY-NC-SA浏览
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[蓝天]的文章
[彭川]的文章
[李森]的文章
百度学术
百度学术中相似的文章
[蓝天]的文章
[彭川]的文章
[李森]的文章
必应学术
必应学术中相似的文章
[蓝天]的文章
[彭川]的文章
[李森]的文章
相关权益政策
暂无数据
收藏/分享
文件名: AAS-CN-2019-0433.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。