CASIA OpenIR

浏览/检索结果: 共8条,第1-8条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
SPEAKER-AWARE SPEECH-TRANSFORMER 会议论文
, 新加坡, 2019-12-14
作者:  Fan ZY(范志赟);  Li J(李杰);  Zhou SY(周世玉);  Xu B(徐波)
Adobe PDF(361Kb)  |  收藏  |  浏览/下载:157/52  |  提交时间:2022/09/17
Speech-Transformer, speaker adaptation, end-to-end speech recognition, speaker aware training, i-vector  
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:248/11  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:309/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
面向语音翻译的文本规范化和端到端建模方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  董倩倩
Adobe PDF(4379Kb)  |  收藏  |  浏览/下载:276/11  |  提交时间:2021/06/24
语音翻译、级联系统、文本规范化、端到端模型  
面向低资源场景的端到端语音识别方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  易澄
Adobe PDF(3846Kb)  |  收藏  |  浏览/下载:342/13  |  提交时间:2021/06/21
低资源语音识别  端到端  预训练  
A Multilayer and Multimodal-Fusion Architecture for Simultaneous Recognition of Endovascular Manipulations and Assessment of Technical Skills 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2020, 卷号: PP, 期号: 99, 页码: 1-13
作者:  Xiaohu,Zhou;  Xiaoliang.Xie;  Zhenqiu,Feng;  Zengguang,Hou;  Guibin,Bian;  Ruiqi,Li;  Zhenliang,Ni;  Shiqi,Liu;  Yan-Jie Zhou
Adobe PDF(2286Kb)  |  收藏  |  浏览/下载:288/59  |  提交时间:2020/11/05
Endovascular manipulations  multilayer and multimodal-fusion architecture (MMFA)  percutaneous coronary intervention (PCI),  technical skill assessment  
First Step Towards End-to-end Parametric TTS Synthesis: Generating Spectral Parameters with Neural Attention 会议论文
, San Francisco, USA, 2016-9-8
作者:  Wang, Wenfu;  Xu, Shuang;  Xu, Bo
收藏  |  浏览/下载:72/0  |  提交时间:2020/10/27
Parametric Tts Synthesis  End-to-end  Attention Based Recurrent Neural Network  Acoustic Modeling  
冠脉介入手术复杂自然操作行为的智能分析与应用 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  周小虎
Adobe PDF(13710Kb)  |  收藏  |  浏览/下载:460/59  |  提交时间:2019/06/27
冠脉介入手术  复杂自然操作行为  介入器械运动精准识别和精确跟踪  介入操作技能综合评价  活体动物实验