CASIA OpenIR

浏览/检索结果: 共23条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
IMPROVING CROSS-MODAL UNDERSTANDING IN VISUAL DIALOG VIA CONTRASTIVE LEARNING 会议论文
, Singapore, 2022.5
作者:  Feilong Chen;  Duzhen Zhang;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(9035Kb)  |  收藏  |  浏览/下载:235/99  |  提交时间:2023/06/07
Unsupervised and Pseudo-Supervised Vision-Language Alignment in Visual Dialog 会议论文
, Lisboa, Portugal, October 10–14, 2022
作者:  Feilong Chen;  Duzhen Zhang;  Xiuyi Chen;  Jing Shi;  Shang Xu;  Bo Xu
Adobe PDF(9035Kb)  |  收藏  |  浏览/下载:276/154  |  提交时间:2023/06/05
Modelling Speaker-dependent Auditory Attention Using A Spiking Neural Network with Temporal Coding and Supervised Learning 会议论文
, Sydney, Australia, December 12-15, 2019
作者:  Yating Huang;  Jiaming Xu;  Bo Xu
Adobe PDF(3377Kb)  |  收藏  |  浏览/下载:206/49  |  提交时间:2022/09/17
鸡尾酒会问题与相关听觉模型的研究现状与展望 期刊论文
自动化学报, 2019, 卷号: 45, 期号: 2, 页码: 234-251
作者:  黄雅婷;  石晶;  许家铭;  徐波
Adobe PDF(3009Kb)  |  收藏  |  浏览/下载:226/77  |  提交时间:2022/09/17
Towards Modeling Auditory Restoration in Noisy Environments 会议论文
, 线上会议, Jul 18, 2021
作者:  Yating Huang;  Yunzhe Hao;  Jiaming Xu;  Bo Xu
Adobe PDF(628Kb)  |  收藏  |  浏览/下载:212/46  |  提交时间:2022/09/17
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:275/12  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
Improving Speech Separation with Adversarial Network and Reinforcement Learning 会议论文
, Rio de Janeiro, Brazil, 2018-07
作者:  Liu, Guangcan;  Shi, Jing;  Chen, Xiuyi;  Xu, Jiaming;  Xu, Bo
Adobe PDF(2787Kb)  |  收藏  |  浏览/下载:214/60  |  提交时间:2022/06/27
Distilled Binary Neural Network for Monaural Speech Separation 会议论文
, Rio de Janeiro, Brazil, 2018-07
作者:  Chen, Xiuyi;  Liu, Guangcan;  Shi, Jing;  Xu, Jiaming;  Xu, Bo
Adobe PDF(1770Kb)  |  收藏  |  浏览/下载:211/56  |  提交时间:2022/06/27
面向低资源场景的端到端语音识别方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  易澄
Adobe PDF(3846Kb)  |  收藏  |  浏览/下载:414/14  |  提交时间:2021/06/21
低资源语音识别  端到端  预训练  
COMBINING UNIDIRECTIONAL LONG SHORT-TERM MEMORY WITH CONVOLUTIONAL OUTPUT LAYER FOR HIGH-PERFORMANCE SPEECH SYNTHESIS 会议论文
, New Orleans, USA, 2017-3-5
作者:  Wang, Wenfu;  Xu, Bo
收藏  |  浏览/下载:75/0  |  提交时间:2020/10/27
Statistical Parametric Speech Synthesis  Lstm  Convolutional Output Layer  High-performance  Trajectory Smoother