CASIA OpenIR

浏览/检索结果: 共10条,第1-10条 帮助

限定条件                        
已选(0)清除 条数/页:   排序方式:
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:275/12  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:355/18  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
复杂场景图像中的文字检测方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2021
作者:  黄燃东
Adobe PDF(21972Kb)  |  收藏  |  浏览/下载:301/2  |  提交时间:2021/06/08
场景文本检测,注意力机制,训练样本不均衡,并行回归分割,卷积 神经网络  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  盛芬芬
Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:517/21  |  提交时间:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
基于循环神经网络的声学建模方法研究 学位论文
, 北京: 中国科学院大学, 2018
作者:  赵媛媛
Adobe PDF(4227Kb)  |  收藏  |  浏览/下载:414/11  |  提交时间:2018/06/13
声学建模  循环神经网络  多维残差学习  词打散  改进的低帧率模型  多场景中文语音识别  
面向机器翻译的语言预处理与性能优化 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  汪春奇
Adobe PDF(2217Kb)  |  收藏  |  浏览/下载:222/4  |  提交时间:2018/06/08
机器翻译  序列标注  中文分词  半监督学习  半自回归  
视音频全局时序特征在疑似广告检测中的应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2012
作者:  张波
Adobe PDF(7235Kb)  |  收藏  |  浏览/下载:176/0  |  提交时间:2015/09/02
广告检测  广告分割  视频分析  多模态融合  在线学习  Commercial Detection  Commercial Segmentation  Video Analysis  Multi-model Fusion  Online Learning  
英语口语超音段层次自动检错与评估技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2011
作者:  黄申
Adobe PDF(3989Kb)  |  收藏  |  浏览/下载:214/1  |  提交时间:2015/09/02
语音识别  计算机辅助语言学习  超音段  流利  韵律  Speech Recognition  Computer Aided Language Learning  Supra-segmental Feature  Fluency  Prosody  
面向英语口语测试的发音错误检测和诊断技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2011
作者:  李宏言
Adobe PDF(2351Kb)  |  收藏  |  浏览/下载:380/2  |  提交时间:2015/09/02
发音错误检测  发音诊断  大人群口语测试  分类器模型  时长模型  错误规则网络  重音错误检测  Mispronunciation Detection  Mispronunciation Diagnosis  Large Scale Spoken Language Test  Classifier Model  Duration Model  Mispronunciation Rule Network  Stress Mispronunciation Detection  
嵌入式汉英双语混合语音识别技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2008
作者:  浦剑涛
Adobe PDF(1119Kb)  |  收藏  |  浏览/下载:175/0  |  提交时间:2015/09/02
嵌入式语音识别  非特定语言语音识别  模型参数共享  鲁棒性  Embedded Speech Recognition  Language Independent Speech Recognition  Sharing Of Acoustic Model Parameters  Robust Speech Recognition