CASIA OpenIR

浏览/检索结果: 共14条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:249/11  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
低资源语言的多语言语音识别建模方法研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  周世玉
Adobe PDF(2353Kb)  |  收藏  |  浏览/下载:1134/8  |  提交时间:2018/12/20
语音识别  多语言  低资源  跨语言  端到端  多语言语音识别  中 英混合语音识别  Asr  Multilingual  Low-resource  Cross-language  Sequence-to-sequence  Multilingual Speech Recognition  English-mandarin Bilingual Speech Recognition  
面向语种识别的深度神经网络建模方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  耿旺
Adobe PDF(5822Kb)  |  收藏  |  浏览/下载:491/9  |  提交时间:2017/07/06
语种识别  神经网络模型  总体差异空间建模  注意力模型  端到端  
基于深度学习的语音识别声学模型建模方法研究 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  李杰
Adobe PDF(5438Kb)  |  收藏  |  浏览/下载:565/14  |  提交时间:2016/06/23
深度学习  语音识别  声学模型建模  
广播视频节目层结构分析及视觉内容检索研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  陈见耸
Adobe PDF(3915Kb)  |  收藏  |  浏览/下载:241/0  |  提交时间:2015/09/02
广播视频  节目层结构分析  音视频模板匹配  重复序列检测  图像检索  台标识别  Broadcast Videos  Program Layer Structure Analysis  Audio/video Template Matching  Repeated Sequence Detection  Image Retrieval  Tv Logo Recognition  
视音频全局时序特征在疑似广告检测中的应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2012
作者:  张波
Adobe PDF(7235Kb)  |  收藏  |  浏览/下载:159/0  |  提交时间:2015/09/02
广告检测  广告分割  视频分析  多模态融合  在线学习  Commercial Detection  Commercial Segmentation  Video Analysis  Multi-model Fusion  Online Learning  
面向英语口语测试的发音错误检测和诊断技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2011
作者:  李宏言
Adobe PDF(2351Kb)  |  收藏  |  浏览/下载:355/2  |  提交时间:2015/09/02
发音错误检测  发音诊断  大人群口语测试  分类器模型  时长模型  错误规则网络  重音错误检测  Mispronunciation Detection  Mispronunciation Diagnosis  Large Scale Spoken Language Test  Classifier Model  Duration Model  Mispronunciation Rule Network  Stress Mispronunciation Detection  
口语测试自动评估技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2009
作者:  江杰
Adobe PDF(1431Kb)  |  收藏  |  浏览/下载:217/0  |  提交时间:2015/09/02
口语自动评估  二次多模型强制切分  增强后验概率向量  文本相似度计算  向量空间模型  Automatic Language Proficiency Evaluation  Two Time Force Alignment With Multi-models  Enhanced Posterior Probability Vector  Text Similarity Calculation  Vector Space Model  
基于音素识别的语种识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2008
作者:  王士进
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:238/0  |  提交时间:2015/09/02
多语言语种识别  Nn-hmm混合模型  Multilingual声学模型  决策树语言模型  随机决策树语言模型  词图  系统融合  Multilingual Language Identification  Nn-hmm Acoustic Model  Multilingual Acoustic Model  Binary-decision Tree Language Model  Random Forest Based Binary-decision Tree Language  Word Lattice  System Combination  Prlm  Pprlm  
多语言语种识别技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
作者:  姜洪臣
Adobe PDF(1145Kb)  |  收藏  |  浏览/下载:272/0  |  提交时间:2015/09/02
多语言语种识别  音频分类  支持向量机  高斯混合模型-全局背景模型  识别置信度  Multilingual Language Identification  Audio Classification  Svm  Gmm-ubm  Recognition Confidence Measure