CASIA OpenIR

浏览/检索结果: 共14条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning to predict salient faces: a novel visual-audio saliency model 会议论文
, Virtual conference, 2020.8.23-2020.8.28
作者:  Yufan Liu;  Minglang Qiao;  Mai Xu;  Bing Li;  Weiming Hu;  Ali Borji
Adobe PDF(4223Kb)  |  收藏  |  浏览/下载:89/13  |  提交时间:2023/05/06
Sequence-level Speaker Change Detection with Difference-based Continuous Integrate-and-fire 期刊论文
Signal Processing Letters, 2022, 页码: 1551-1554
作者:  Fan ZY(范志赟);  Dong LH(董林昊);  Cai M(蔡猛);  Ma ZJ(马泽君);  Xu B(徐波)
Adobe PDF(404Kb)  |  收藏  |  浏览/下载:159/38  |  提交时间:2022/09/17
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:239/11  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:297/17  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:301/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
Rnn-transducer With Language Bias For End-to-end Mandarin-English Code-switching Speech Recognition 会议论文
, Hong Kong, 2021-1-24
作者:  Shuai Zhang
Adobe PDF(1191Kb)  |  收藏  |  浏览/下载:135/45  |  提交时间:2022/06/17
跨模态信息融合的语音翻译方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  刘宇宸
Adobe PDF(2516Kb)  |  收藏  |  浏览/下载:231/13  |  提交时间:2021/06/21
语音翻译  语音识别  机器翻译  多模态学习  
AN INVESTIGATION OF SUMMED-CHANNEL SPEAKER RECOGNITION WITH MULTI-SESSION ENROLLMENT 会议论文
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Florence, 2014
作者:  Shanshan, Zhang;  Ce, Zhang;  Rong, Zheng;  Xu, Bo;  Shanshan,Zhang
收藏  |  浏览/下载:43/0  |  提交时间:2020/10/27
Speaker Recognition  Summed-channel  Speaker Clustering  Multi-session  
The ZTSpeech System for CHiME-5 Challenge: A Far-field Speech Recognition System with Front-end and Robust Back-end 会议论文
, Hyderabad, India, 2018-9
作者:  Li, Chenxing;  Wang Tieqiang
浏览  |  Adobe PDF(245Kb)  |  收藏  |  浏览/下载:238/58  |  提交时间:2020/07/21
复杂场景语音前端增强与分离算法研究 学位论文
工学学位, 北京: 中国科学院自动化研究所, 2020
作者:  李晨星
Adobe PDF(11281Kb)  |  收藏  |  浏览/下载:307/15  |  提交时间:2020/07/20
语音去混响  语音增强  语音分离  远场语音识别