CASIA OpenIR

浏览/检索结果: 共12条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
Decoupling_Pronunciation_and_Language_for_End-to-End_Code-Switching_Automatic_Speech_Recognition 会议论文
, Toronto, ON, Canada, 2021-6-11
作者:  Shuai Zhang
Adobe PDF(1462Kb)  |  收藏  |  浏览/下载:136/39  |  提交时间:2022/06/17
End-to-End Spelling Correction Conditioned on Acoustic Feature for Code-switching Speech Recognition 会议论文
, Brno, Czechia, 2021-8-30
作者:  Shuai Zhang
Adobe PDF(327Kb)  |  收藏  |  浏览/下载:201/66  |  提交时间:2022/06/17
One In A Hundred: Selecting the Best Predicted Sequence from Numerous Candidates for Speech Recognition 会议论文
, Tokyo, Japan, 14-17 December 2021
作者:  Zhengkun Tian;  Jiangyan Yi;  Ye Bai;  Jianhua Tao;  Shuai Zhang;  Zhengqi Wen
Adobe PDF(563Kb)  |  收藏  |  浏览/下载:195/47  |  提交时间:2022/06/14
Fast End-to-End Speech Recognition via Non-Autoregressive Models and Cross-Modal Knowledge Transferring from BERT 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, 期号: 29, 页码: 1897 - 1911
作者:  Ye Bai;  Jiangyan Yi;  Jianhua Tao;  Zhengkun Tian;  Zhengqi Wen;  Shuai Zhang
Adobe PDF(1163Kb)  |  收藏  |  浏览/下载:208/64  |  提交时间:2021/06/25
端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别  
面向交互场景的情感识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  连政
Adobe PDF(4140Kb)  |  收藏  |  浏览/下载:214/15  |  提交时间:2021/06/16
交互场景  情感识别  情感特征提取  多模态融合  个体信息建模  
DECN: Dialogical Emotion Correction Network for Conversational Emotion Recognition 期刊论文
Neurocomputing, 2021, 期号: 0, 页码: 0
作者:  Zheng Lian;  Bin Liu;  Jianhua Tao
Adobe PDF(2238Kb)  |  收藏  |  浏览/下载:177/35  |  提交时间:2021/06/16
Emotion recognition in conversations (ERC)  Context-sensitive modeling  Dialogical Emotion Correction Network (DECN)  Interaction modeling  
Deep Time Delay Neural Network for Speech Enhancement with Full Data Learning 会议论文
, Hong Kong, 24-27 Jan. 2021
作者:  Fan, Cunhang;  Liu, Bin;  Tao, Jianhua;  Yi, Jiangyan;  Wen, Zhengqi;  Song, Leichao
Adobe PDF(934Kb)  |  收藏  |  浏览/下载:254/61  |  提交时间:2021/06/01
基于语言知识迁移的端到端语音识别方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  白烨
Adobe PDF(7085Kb)  |  收藏  |  浏览/下载:246/12  |  提交时间:2021/06/01
端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别  
基于音视频的自动抑郁检测研究 学位论文
, 北京: 中国科学院自动化研究所, 2021
作者:  牛明月
Adobe PDF(3264Kb)  |  收藏  |  浏览/下载:247/7  |  提交时间:2021/06/01
多模态抑郁检测  面部纹理细节  MFCC的时空属性  池化的范数类型  关键的音视频帧  注意力机制  模态互补信息  
基于多域听觉特征建模的说话人无关语音分离方法研究 学位论文
, 北京市: 中国科学院自动化研究所, 2021
作者:  范存航
Adobe PDF(3377Kb)  |  收藏  |  浏览/下载:266/12  |  提交时间:2021/06/01
说话人无关语音分离  听觉特征建模  深度嵌入式特征  深度注意力融合特征  门控递归融合