CASIA OpenIR

Browse/Search Results:  1-10 of 130 Help

Selected(0)Clear Items/Page:    Sort:
多通道语音增强优化建模方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2021
Authors:  李冠君
Adobe PDF(5732Kb)  |  Favorite  |  View/Download:33/1  |  Submit date:2021/06/07
多通道语音增强,非点源噪声场景,点源噪声场景,复杂噪声场景,自动语音识别  
Object Reconstruction Based on Attentive Recurrent Network from Single and Multiple Images 期刊论文
NEURAL PROCESSING LETTERS, 2021, 期号: 53, 页码: 18
Authors:  Gao, Zishu;  Li, En;  Wang, Zhe;  Yang, Guodong;  Lu, Jiwu;  Ouyang, Bo;  Xu, Dawei;  Liang, Zize
Adobe PDF(1338Kb)  |  Favorite  |  View/Download:14/0  |  Submit date:2021/03/01
Object reconstruction  Convolutional LSTM  Visual attention  Robotic application  
Deep Audio-Visual Learning: A Survey 期刊论文
International Journal of Automation and Computing, 2021, 卷号: 18, 期号: 3, 页码: 351-376
Authors:  Hao Zhu;  Man-Di Luo;  Rui Wang;  Ai-Hua Zheng;  Ran He
Adobe PDF(1864Kb)  |  Favorite  |  View/Download:5/0  |  Submit date:2021/05/24
Deep audio-visual learning  audio-visual separation and localization  correspondence learning  generative models  representation learning  
Deep Neural Network-based Generalized Sidelobe Canceller for Dual-channel Far-field Speech Recognition 期刊论文
Neural Networks, 2021, 期号: Volume 141,, 页码: Pages 225-237
Authors:  Li GJ(李冠君)
Adobe PDF(1911Kb)  |  Favorite  |  View/Download:0/0  |  Submit date:2021/06/18
Deep neural networkGeneralized sidelobe cancellerDual-channelFar-field speech recognition  
A time-frequency channel attention and vectorization network for automatic depression level prediction 期刊论文
Neurocomputing, 2021, 期号: 450, 页码: 208-218
Authors:  Mingyue Niu;  Bin Liu;  Jianhua Tao;  Qifei Li
Adobe PDF(2001Kb)  |  Favorite  |  View/Download:10/0  |  Submit date:2021/06/01
Sphere embedding normalization  DenseNet  Transition layer  Time-frequency channel attention block  Time-frequency vectorization block  Depression detection  
复杂场景语音前端增强与分离算法研究 学位论文
工学学位, 北京: 中国科学院自动化研究所, 2020
Authors:  李晨星
Adobe PDF(11281Kb)  |  Favorite  |  View/Download:110/5  |  Submit date:2020/07/20
语音去混响  语音增强  语音分离  远场语音识别  
融合图像与文本的多模态情感分析方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  徐楠
Adobe PDF(4227Kb)  |  Favorite  |  View/Download:223/11  |  Submit date:2020/06/10
多模态情感分析  图像语义  信息交互  属性级  多模态数据增强  
面向多模态序列数据的模式分类方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2020
Authors:  谢龙飞
Adobe PDF(1957Kb)  |  Favorite  |  View/Download:116/1  |  Submit date:2020/06/11
多模态模式识别  情感识别  异质数据融合  生成对抗网络  注意力机制  
面向数据失配的鲁棒性声学建模方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2020
Authors:  刘斌
Adobe PDF(2027Kb)  |  Favorite  |  View/Download:104/4  |  Submit date:2020/06/09
鲁棒性声学建模  语音识别  对抗学习  语音唤醒  
个性化语音合成方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2020
Authors:  傅睿博
Adobe PDF(3985Kb)  |  Favorite  |  View/Download:150/11  |  Submit date:2020/06/21
语音合成  个性化定制  声学建模  说话人特征空间建模  韵律建模