已选(0)清除
条数/页: 排序方式: |
| Decoupling_Pronunciation_and_Language_for_End-to-End_Code-Switching_Automatic_Speech_Recognition 会议论文 , Toronto, ON, Canada, 2021-6-11 作者: Shuai Zhang Adobe PDF(1462Kb)  |  收藏  |  浏览/下载:136/39  |  提交时间:2022/06/17 |
| End-to-End Spelling Correction Conditioned on Acoustic Feature for Code-switching Speech Recognition 会议论文 , Brno, Czechia, 2021-8-30 作者: Shuai Zhang Adobe PDF(327Kb)  |  收藏  |  浏览/下载:201/66  |  提交时间:2022/06/17 |
| One In A Hundred: Selecting the Best Predicted Sequence from Numerous Candidates for Speech Recognition 会议论文 , Tokyo, Japan, 14-17 December 2021 作者: Zhengkun Tian; Jiangyan Yi; Ye Bai; Jianhua Tao; Shuai Zhang; Zhengqi Wen Adobe PDF(563Kb)  |  收藏  |  浏览/下载:195/47  |  提交时间:2022/06/14 |
| Fast End-to-End Speech Recognition via Non-Autoregressive Models and Cross-Modal Knowledge Transferring from BERT 期刊论文 IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, 期号: 29, 页码: 1897 - 1911 作者: Ye Bai; Jiangyan Yi; Jianhua Tao; Zhengkun Tian; Zhengqi Wen; Shuai Zhang Adobe PDF(1163Kb)  |  收藏  |  浏览/下载:208/64  |  提交时间:2021/06/25 端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别 |
| 面向交互场景的情感识别研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 连政 Adobe PDF(4140Kb)  |  收藏  |  浏览/下载:214/15  |  提交时间:2021/06/16 交互场景 情感识别 情感特征提取 多模态融合 个体信息建模 |
| DECN: Dialogical Emotion Correction Network for Conversational Emotion Recognition 期刊论文 Neurocomputing, 2021, 期号: 0, 页码: 0 作者: Zheng Lian; Bin Liu; Jianhua Tao Adobe PDF(2238Kb)  |  收藏  |  浏览/下载:177/35  |  提交时间:2021/06/16 Emotion recognition in conversations (ERC) Context-sensitive modeling Dialogical Emotion Correction Network (DECN) Interaction modeling |
| Deep Time Delay Neural Network for Speech Enhancement with Full Data Learning 会议论文 , Hong Kong, 24-27 Jan. 2021 作者: Fan, Cunhang; Liu, Bin; Tao, Jianhua; Yi, Jiangyan; Wen, Zhengqi; Song, Leichao Adobe PDF(934Kb)  |  收藏  |  浏览/下载:254/61  |  提交时间:2021/06/01 |
| 基于语言知识迁移的端到端语音识别方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 白烨 Adobe PDF(7085Kb)  |  收藏  |  浏览/下载:246/12  |  提交时间:2021/06/01 端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别 |
| 基于音视频的自动抑郁检测研究 学位论文 , 北京: 中国科学院自动化研究所, 2021 作者: 牛明月 Adobe PDF(3264Kb)  |  收藏  |  浏览/下载:247/7  |  提交时间:2021/06/01 多模态抑郁检测 面部纹理细节 MFCC的时空属性 池化的范数类型 关键的音视频帧 注意力机制 模态互补信息 |
| 基于多域听觉特征建模的说话人无关语音分离方法研究 学位论文 , 北京市: 中国科学院自动化研究所, 2021 作者: 范存航 Adobe PDF(3377Kb)  |  收藏  |  浏览/下载:266/12  |  提交时间:2021/06/01 说话人无关语音分离 听觉特征建模 深度嵌入式特征 深度注意力融合特征 门控递归融合 |