CASIA OpenIR

浏览/检索结果: 共70条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Complex Dynamic Neurons Improved Spiking Transformer Network for Efficient Automatic Speech Recognition 会议论文
, Washington D.C., USA, 2023-2-9
作者:  Qingyu Wang;  Tielin Zhang;  Minglun Han;  Yi Wang;  Duzhen Zhang;  Bo Xu
Adobe PDF(1714Kb)  |  收藏  |  浏览/下载:124/41  |  提交时间:2023/06/20
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:111/27  |  提交时间:2023/06/21
Towards efficient full 8-bit integer DNN online training on resource-limited devices without batch normalization 期刊论文
NEUROCOMPUTING, 2022, 卷号: 511, 页码: 175-186
作者:  Yang, Yukuan;  Chi, Xiaowei;  Deng, Lei;  Yan, Tianyi;  Gao, Feng;  Li, Guoqi
收藏  |  浏览/下载:176/0  |  提交时间:2022/11/21
Full 8-bit quantization  Network without batch normalization  Small batch  Online training  Resource-limited devices  
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:236/11  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:297/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
Compressing Speaker Extraction Model with Ultra-low Precision Quantization and Knowledge Distillation 期刊论文
Neural Networks, 2022, 卷号: 154, 页码: 13-21
作者:  Yating Huang;  Yunzhe Hao;  Jiaming Xu;  Bo Xu
Adobe PDF(801Kb)  |  收藏  |  浏览/下载:177/47  |  提交时间:2022/09/17
Modeling learnable electrical synapse for high precision spatio-temporal recognition 期刊论文
NEURAL NETWORKS, 2022, 卷号: 149, 页码: 184-194
作者:  Wu, Zhenzhi;  Zhang, Zhihong;  Gao, Huanhuan;  Qin, Jun;  Zhao, Rongzhen;  Zhao, Guangshe;  Li, Guoqi
收藏  |  浏览/下载:141/0  |  提交时间:2022/07/25
Electrical synapse  coupling  Leaky-integrate-and-fire model  Spatio-temporal information  Bio-plausible neuronal dynamics  
Unsupervised and Pseudo-Supervised Vision-Language Alignment in Visual Dialog 会议论文
, Lisboa, Portugal, October 10–14, 2022
作者:  Feilong Chen;  Duzhen Zhang;  Xiuyi Chen;  Jing Shi;  Shang Xu;  Bo Xu
Adobe PDF(9035Kb)  |  收藏  |  浏览/下载:227/143  |  提交时间:2023/06/05
Improving End-to-End Contextual Speech Recognition with Fine-Grained Contextual Knowledge Selection 会议论文
, Singapore, Singapore, 2022.05
作者:  Minglun Han;  Linhao Dong;  Zhenlin Liang;  Meng Cai;  Shiyu Zhou;  Zejun Ma;  Bo Xu
Adobe PDF(463Kb)  |  收藏  |  浏览/下载:146/43  |  提交时间:2023/05/29
Automatic Speech Recognition  Context Biasing  Speech Recognition Customization  Continuous Integrate-and-Fire Mechanism  
Sequence-level Speaker Change Detection with Difference-based Continuous Integrate-and-fire 期刊论文
Signal Processing Letters, 2022, 页码: 1551-1554
作者:  Fan ZY(范志赟);  Dong LH(董林昊);  Cai M(蔡猛);  Ma ZJ(马泽君);  Xu B(徐波)
Adobe PDF(404Kb)  |  收藏  |  浏览/下载:154/37  |  提交时间:2022/09/17