CASIA OpenIR

Browse/Search Results:  1-10 of 46 Help

Selected(0)Clear Items/Page:    Sort:
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  黄雅婷
Adobe PDF(3433Kb)  |  Favorite  |  View/Download:131/9  |  Submit date:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  范志赟
Adobe PDF(3323Kb)  |  Favorite  |  View/Download:96/5  |  Submit date:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  郝云喆
Adobe PDF(5007Kb)  |  Favorite  |  View/Download:158/10  |  Submit date:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
SpecMNet: Spectrum mend network for monaural speech enhancement 期刊论文
APPLIED ACOUSTICS, 2022, 卷号: 194, 页码: 9
Authors:  Fan, Cunhang;  Zhang, Hongmei;  Yi, Jiangyan;  Lv, Zhao;  Tao, Jianhua;  Li, Taihao;  Pei, Guanxiong;  Wu, Xiaopei;  Li, Sheng
Favorite  |  View/Download:60/0  |  Submit date:2022/07/25
Monaural speech enhancement  Speech distortion  Spectrum mend network  SI-SNR  BLSTM  
Compressing Speaker Extraction Model with Ultra-low Precision Quantization and Knowledge Distillation 期刊论文
Neural Networks, 2022, 卷号: 154, 页码: 13-21
Authors:  Yating Huang;  Yunzhe Hao;  Jiaming Xu;  Bo Xu
Adobe PDF(801Kb)  |  Favorite  |  View/Download:59/11  |  Submit date:2022/09/17
智能对话系统中的知识表示、激活与利用研究 学位论文
工学博士, 中国科学院自动化研究所: casia, 2022
Authors:  陈修意
Adobe PDF(5912Kb)  |  Favorite  |  View/Download:119/9  |  Submit date:2022/06/14
对话系统,知识表示,知识对话生成  
Towards Modeling Auditory Restoration in Noisy Environments 会议论文
, 线上会议, Jul 18, 2021
Authors:  Yating Huang;  Yunzhe Hao;  Jiaming Xu;  Bo Xu
Adobe PDF(628Kb)  |  Favorite  |  View/Download:55/7  |  Submit date:2022/09/17
基于多域听觉特征建模的说话人无关语音分离方法研究 学位论文
, 北京市: 中国科学院自动化研究所, 2021
Authors:  范存航
Adobe PDF(3377Kb)  |  Favorite  |  View/Download:155/10  |  Submit date:2021/06/01
说话人无关语音分离  听觉特征建模  深度嵌入式特征  深度注意力融合特征  门控递归融合  
Deep Time Delay Neural Network for Speech Enhancement with Full Data Learning 会议论文
, Hong Kong, 24-27 Jan. 2021
Authors:  Fan, Cunhang;  Liu, Bin;  Tao, Jianhua;  Yi, Jiangyan;  Wen, Zhengqi;  Song, Leichao
Adobe PDF(934Kb)  |  Favorite  |  View/Download:67/5  |  Submit date:2021/06/01
Gated Recurrent Fusion With Joint Training Framework for Robust End-to-End Speech Recognition 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2021, 期号: 29, 页码: 198-209
Authors:  Fan, Cunhang;  Yi, Jiangyan;  Tao, Jianhua;  Tian, Zhengkun;  Liu, Bin;  Wen, Zhengqi
Adobe PDF(2534Kb)  |  Favorite  |  View/Download:139/12  |  Submit date:2021/03/08
Speech enhancement  Speech recognition  Training  Noise measurement  Logic gates  Acoustic distortion  Task analysis  Gated recurrent fusion  robust end-to-end speech recognition  speech distortion  speech enhancement  speech transformer