CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
鲁棒的自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  李小倩
Adobe PDF(23215Kb)  |  收藏  |  浏览/下载:242/12  |  提交时间:2021/06/29
自然场景  文本检测  文本识别  
A Unified Framework for Low-Latency Speaker Extraction in Cocktail Party Environments 会议论文
, Shanghai, China, October 25–29, 2020
作者:  Yunzhe Hao;  Jiaming Xu;  Jing Shi;  Peng Zhang;  Lei Qin;  Bo Xu
Adobe PDF(399Kb)  |  收藏  |  浏览/下载:202/51  |  提交时间:2022/06/23
Graph-based neural networks for explainable image privacy inference 期刊论文
PATTERN RECOGNITION, 2020, 卷号: 105, 期号: 0, 页码: 12
作者:  Yang, Guang;  Cao, Juan;  Chen, Zhineng;  Guo, Junbo;  Li, Jintao
浏览  |  Adobe PDF(2906Kb)  |  收藏  |  浏览/下载:264/19  |  提交时间:2020/08/03
Image privacy protection  Graph neural networks  Image classification  
Single shot multi-oriented text detection based on local and non-local features 期刊论文
INTERNATIONAL JOURNAL ON DOCUMENT ANALYSIS AND RECOGNITION, 2020, 期号: 2020, 页码: 241-252
作者:  Li, XiaoQian;  Liu, Jie;  Zhang, ShuWu;  Zhang, GuiXuan;  Zheng, Yang
浏览  |  Adobe PDF(2525Kb)  |  收藏  |  浏览/下载:284/48  |  提交时间:2020/09/07
Text detection  Natural scene text  Convolutional neural network  Attention mechanism  
复杂场景语音前端增强与分离算法研究 学位论文
工学学位, 北京: 中国科学院自动化研究所, 2020
作者:  李晨星
Adobe PDF(11281Kb)  |  收藏  |  浏览/下载:310/15  |  提交时间:2020/07/20
语音去混响  语音增强  语音分离  远场语音识别  
IBN-STR: A Robust Text Recognizer for Irregular Text in Natural Scenes 会议论文
, MiLan, Italy, 2021-01-10
作者:  Li XQ(李小倩);  Liu J(刘杰);  Zhang GX(张桂煊);  Zhang SW(张树武)
浏览  |  Adobe PDF(450Kb)  |  收藏  |  浏览/下载:201/62  |  提交时间:2020/10/23
Text Recognition  
Adaptive Attention Annotation Model: Optimizing the Prediction Path through Dependency Fusion 期刊论文
KSII TRANSACTIONS ON INTERNET AND INFORMATION SYSTEMS, 2019, 卷号: 13, 期号: 9, 页码: 4665-4683
作者:  Wang, Fangxin;  Liu, Jie;  Zhang, Shuwu;  Zhang, Guixuan;  Zheng, Yang;  Li, Xiaoqian;  Liang, Wei;  Li, Yuejun
浏览  |  Adobe PDF(1061Kb)  |  收藏  |  浏览/下载:375/57  |  提交时间:2019/10/08
image annotation  multiple dependencies  self-attention  prediction path  Triplet Margin loss  
Structure-Aware Deep Learning for Product Image Classification 期刊论文
ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS, 2019, 卷号: 15, 期号: 1, 页码: 20
作者:  Chen, Zhineng;  Al, Shanshan;  Jia, Caiyan
浏览  |  Adobe PDF(7349Kb)  |  收藏  |  浏览/下载:263/17  |  提交时间:2019/07/12
Image classification  category hierarchy  convolutional neural network  multi-class regression  multi-task learning  
The ZTSpeech System for CHiME-5 Challenge: A Far-field Speech Recognition System with Front-end and Robust Back-end 会议论文
, Hyderabad, India, 2018-9
作者:  Li, Chenxing;  Wang Tieqiang
浏览  |  Adobe PDF(245Kb)  |  收藏  |  浏览/下载:241/60  |  提交时间:2020/07/21
Recurrent Neural Network Based Small-footprint Wake-up-word Speech Recognition System with a Score Calibration Method 会议论文
, Beijing, 2018-8
作者:  Li, Chenxing;  Zhu, Lei;  Xu, Shuang;  Gao, Peng;  Xu, Bo
浏览  |  Adobe PDF(4877Kb)  |  收藏  |  浏览/下载:163/60  |  提交时间:2020/07/20