CASIA OpenIR

浏览/检索结果: 共54条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Probability Enhanced Entropy (PEE) Novel Feature for Improved Bird Sound Classification 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 1, 页码: 52-62
作者:  Ramashini Murugaiya;  Pg Emeroylariffion Abas;  Liyanage Chandratilak De Silva
Adobe PDF(1168Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/04/23
Bird sounds  classification  Gammatone frequency cepstral coefficient (GTCC)  probability enhanced entropy (PEE)  support vector machine (SVM)  
Singing-Tacotron: Global Duration Control Attention and Dynamic Filter for End-to-end Singing Voice Synthesis 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2873Kb)  |  收藏  |  浏览/下载:56/22  |  提交时间:2023/08/07
SPEAKER-AWARE SPEECH-TRANSFORMER 会议论文
, 新加坡, 2019-12-14
作者:  Fan ZY(范志赟);  Li J(李杰);  Zhou SY(周世玉);  Xu B(徐波)
Adobe PDF(361Kb)  |  收藏  |  浏览/下载:167/55  |  提交时间:2022/09/17
Speech-Transformer, speaker adaptation, end-to-end speech recognition, speaker aware training, i-vector  
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:262/12  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
Learn Spelling from Teachers: Transferring Knowledge from Language Models to Sequence-to-Sequence Speech Recognition 会议论文
, Graz, 2019
作者:  Ye Bai;  Jiangyan Yi;  Jianhua Tao;  Zhengkun Tian;  Zhengqi Wen
Adobe PDF(779Kb)  |  收藏  |  浏览/下载:74/10  |  提交时间:2021/06/25
Fast End-to-End Speech Recognition via Non-Autoregressive Models and Cross-Modal Knowledge Transferring from BERT 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, 期号: 29, 页码: 1897 - 1911
作者:  Ye Bai;  Jiangyan Yi;  Jianhua Tao;  Zhengkun Tian;  Zhengqi Wen;  Shuai Zhang
Adobe PDF(1163Kb)  |  收藏  |  浏览/下载:194/58  |  提交时间:2021/06/25
端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别  
跨模态信息融合的语音翻译方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  刘宇宸
Adobe PDF(2516Kb)  |  收藏  |  浏览/下载:246/13  |  提交时间:2021/06/21
语音翻译  语音识别  机器翻译  多模态学习  
面向低资源场景的端到端语音识别方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  易澄
Adobe PDF(3846Kb)  |  收藏  |  浏览/下载:382/14  |  提交时间:2021/06/21
低资源语音识别  端到端  预训练  
基于类脑脉冲神经网络的音乐学习模型 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2021
作者:  梁倩
Adobe PDF(12051Kb)  |  收藏  |  浏览/下载:254/3  |  提交时间:2021/06/11
类脑脉冲神经网络  多脑区协同模型  音乐记忆  音乐学习  音乐作曲  
Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese 会议论文
Interspeech, 印度的海德拉巴, 2018
作者:  Shiyu Zhou;  Linhao Dong;  Shuang Xu;  Bo Xu
收藏  |  浏览/下载:98/0  |  提交时间:2020/10/27
Asr  Multi-head Attention  Syllable Based Acoustic Modeling  Sequence-to-sequence