CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
多通道语音增强优化建模方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2021
作者:  李冠君
Adobe PDF(5732Kb)  |  收藏  |  浏览/下载:249/6  |  提交时间:2021/06/07
多通道语音增强,非点源噪声场景,点源噪声场景,复杂噪声场景,自动语音识别  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  郭龙腾
Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:301/20  |  提交时间:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
Page Segmentation Using Convolutional Neural Network and Graphical Model 会议论文
, 视频会议, 2020-7
作者:  Li, Xiao-Hui;  Yin, Fei;  Liu, Cheng-Lin
Adobe PDF(6979Kb)  |  收藏  |  浏览/下载:163/43  |  提交时间:2021/06/02
Page segmentation  Conditional random field  Feature pyramid network  Graph attention network  
Jointly Adversarial Enhancement Training for Robust End-to-End Speech Recognition 会议论文
, Graz, Austria, 2019-9-15
作者:  Liu, Bin;  Nie, Shuai;  Liang, Shan;  Liu, Wenju;  Yu, Meng;  Chen, Lianwu;  Peng, Shouye;  Li, Changliang
浏览  |  Adobe PDF(350Kb)  |  收藏  |  浏览/下载:229/97  |  提交时间:2020/05/15
End-to-end Speech Recognition  Robust Speech Recognition  Speech Enhancement  Generative Adversarial Networks  
Sequence-to-Sequence Domain Adaptation Network for Robust Text Image Recognition 会议论文
, Long Beach, CA, 2019.06.16-2019.06.20
作者:  Zhang, Yaping;  Nie, Shuai;  Liu, Wenju;  Xu, Xing;  Zhang, Dongxiang;  Shen, Hengtao
浏览  |  Adobe PDF(718Kb)  |  收藏  |  浏览/下载:274/96  |  提交时间:2020/05/15
Domain Adaptation  Text Image Recognition  
Focal Loss And Double-Edge-Triggered Detector For Robust Small-Footprint Keyword Spotting 会议论文
, Brighton, United Kingdom, 2019-5-13
作者:  Liu, Bin;  Nie, Shuai;  Zhang, Yaping;  Liang, Shan;  Yang, Zhanlei;  Liu, Wenju
浏览  |  Adobe PDF(1111Kb)  |  收藏  |  浏览/下载:631/385  |  提交时间:2020/05/15
Keyword Spotting  Focal Loss  Double-edgetriggered Detecting Method  Speech Recognition  
Decision Controller for Object Tracking With Deep Reinforcement Learning 期刊论文
IEEE ACCESS, 2019, 卷号: 7, 页码: 28069-28079
作者:  Zhong, Zhao;  Yang, Zichen;  Feng, Weitao;  Wu, Wei;  Hu, Yangyang;  Liu, Cheng-Lin
Adobe PDF(2984Kb)  |  收藏  |  浏览/下载:567/196  |  提交时间:2019/04/30
Computer vision  deep learning  object tracking  reinforcement learning  
Instance Aware Document Image Segmentation using Label Pyramid Networks and Deep Watershed Transformation 会议论文
, 澳大利亚悉尼国际会议中心(ICC), 2019-9
作者:  Li, Xiao-Hui;  Yin, Fei;  Xue, Tao;  Liu, Long;  Ogier, Jean-Marc;  Liu, Cheng-Lin
Adobe PDF(1690Kb)  |  收藏  |  浏览/下载:168/37  |  提交时间:2021/06/02
document image segmentation  instance segmentation  label pyramid network  deep watershed transformation  
Stochastic Multiple Choice Learning for Acoustic Modeling 会议论文
, Rio de Janeiro, 巴西, 2018-07-08
作者:  Liu, Bin;  Nie, Shuai;  Liang, Shan;  Yang, Zhanlei;  Liu, Wenju
浏览  |  Adobe PDF(529Kb)  |  收藏  |  浏览/下载:167/65  |  提交时间:2020/06/08
Boosting noise robustness of acoustic model via deep adversarial training 会议论文
, 加拿大卡尔加里, 2018-4-15
作者:  Liu, Bin;  Nie, Shuai;  Zhang, Yaping;  Ke, Dengfeng;  Liang, Shan;  Liu, Wenju
浏览  |  Adobe PDF(300Kb)  |  收藏  |  浏览/下载:182/82  |  提交时间:2020/05/15
Robust Speech Recognition  Deep Adversarial Training  Acoustic Model  Generative Adversarial Net