CASIA OpenIR

浏览/检索结果: 共19条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Humor Detection System for MuSE 2023: Contextual Modeling, Pseudo Labelling, and Post-smoothing 会议论文
, 加拿大多伦多, 2023-11
作者:  Xu MY(徐名宇);  Chen S(陈顺);  Lian Z(连政);  Liu B(刘斌)
Adobe PDF(557Kb)  |  收藏  |  浏览/下载:36/12  |  提交时间:2024/06/27
Spoken Content and Voice Factorization for Few-shot Speaker Adaptation 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(1514Kb)  |  收藏  |  浏览/下载:111/35  |  提交时间:2023/08/07
Decoupling_Pronunciation_and_Language_for_End-to-End_Code-Switching_Automatic_Speech_Recognition 会议论文
, Toronto, ON, Canada, 2021-6-11
作者:  Shuai Zhang
Adobe PDF(1462Kb)  |  收藏  |  浏览/下载:145/42  |  提交时间:2022/06/17
Rnn-transducer With Language Bias For End-to-end Mandarin-English Code-switching Speech Recognition 会议论文
, Hong Kong, 2021-1-24
作者:  Shuai Zhang
Adobe PDF(1191Kb)  |  收藏  |  浏览/下载:179/56  |  提交时间:2022/06/17
端到端中英混合语音识别方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学人工智能学院, 2022
作者:  张帅
Adobe PDF(2551Kb)  |  收藏  |  浏览/下载:292/18  |  提交时间:2022/06/17
端到端语音识别  中英混合  语种语音联合建模  多语上下文  语义一致性  
跨模态信息融合的语音翻译方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  刘宇宸
Adobe PDF(2516Kb)  |  收藏  |  浏览/下载:269/13  |  提交时间:2021/06/21
语音翻译  语音识别  机器翻译  多模态学习  
Self-attention Based Model for Punctuation Prediction Using Word and Speech Embeddings 会议论文
, Brighton, UK, 2019.05.12-2019.05.15
作者:  Jiangyan Yi;  Jianhua Tao
浏览  |  Adobe PDF(273Kb)  |  收藏  |  浏览/下载:46/19  |  提交时间:2020/10/22
Language-invariant Bottleneck Features from Adversarial End-to-end Acoustic Models for Low Resource Speech Recognition 会议论文
, Brighton, UK, 2019.05.12-2019.05.18
作者:  Jiangyan Yi;  Jianhua Tao;  Ye Bai
浏览  |  Adobe PDF(295Kb)  |  收藏  |  浏览/下载:122/53  |  提交时间:2020/10/22
CTC Regularized Model Adaptation for Improving LSTM RNN Based Multi-Accent Mandarin Speech Recognition 期刊论文
JOURNAL OF SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY, 2018, 卷号: 90, 期号: 7, 页码: 985-997
作者:  Jiangyan Yi;  Zhengqi Wen;  Jianhua Tao;  Hao Ni;  Bin Liu
浏览  |  Adobe PDF(1416Kb)  |  收藏  |  浏览/下载:177/66  |  提交时间:2020/10/22
multi-accent, Mandarin speech recognition,LSTM-RNN-CTC, model adaptation, CTC regularization  
Phoneme dependent speaker embedding and model factorization for multi-speaker speech synthesis and adaptation 会议论文
, Brighton,UK, MAY 12-17,2019
作者:  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi;  Zheng, Yibin
浏览  |  Adobe PDF(429Kb)  |  收藏  |  浏览/下载:265/93  |  提交时间:2020/06/24
speech synthesis  speaker adaptation  speaker embedding  phoneme representation