CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:302/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  盛芬芬
Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:478/21  |  提交时间:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
基于循环神经网络的声学建模方法研究 学位论文
, 北京: 中国科学院大学, 2018
作者:  赵媛媛
Adobe PDF(4227Kb)  |  收藏  |  浏览/下载:383/11  |  提交时间:2018/06/13
声学建模  循环神经网络  多维残差学习  词打散  改进的低帧率模型  多场景中文语音识别  
基于深度神经网络的大规模声学模型训练研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  游钊
Adobe PDF(1685Kb)  |  收藏  |  浏览/下载:337/0  |  提交时间:2015/09/02
深度神经网络  声学模型  深层玻尔兹曼机  分布式并行训练  多通道混合训练  Deep Neural Network  Acoustic Model  Deep Boltzmann Machine  Distributed Parallel Training  Mixed-bandwidth Training  
统计机器翻译中模型的训练、自适应和学习算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2014
作者:  卢世祥
Adobe PDF(2569Kb)  |  收藏  |  浏览/下载:286/0  |  提交时间:2015/09/02
统计机器翻译  大规模语言模型  翻译模型  领域自适应  深度神经网络  Statistical Machine Translation  Large-scale Language Model  Translation Model  Domain Adaptation  Deep Neural Network  
电话信道下说话人分离及识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  张策
Adobe PDF(1685Kb)  |  收藏  |  浏览/下载:380/0  |  提交时间:2015/09/02
说话人识别  说话人分离  因子分析  高斯混合模型  贝叶斯分析  Speaker Recognition  Speaker Diarization  Factor Analysis  Gaussian Mixture Models  Bayesian Analysis  
音频信息检索关键技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2009
作者:  王磊
Adobe PDF(1915Kb)  |  收藏  |  浏览/下载:216/0  |  提交时间:2015/09/02
哼唱音乐检索  音频模板检索  音频分类  广播新闻条目自动分割  Query By Singing/humming  Audio Template Searching  Audio Classification  Broadcasting News Story Segmentation  
嵌入式汉英双语混合语音识别技术的研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2008
作者:  浦剑涛
Adobe PDF(1119Kb)  |  收藏  |  浏览/下载:159/0  |  提交时间:2015/09/02
嵌入式语音识别  非特定语言语音识别  模型参数共享  鲁棒性  Embedded Speech Recognition  Language Independent Speech Recognition  Sharing Of Acoustic Model Parameters  Robust Speech Recognition  
面向多语言语音识别的声学建模研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2008
作者:  孟猛
Adobe PDF(908Kb)  |  收藏  |  浏览/下载:242/0  |  提交时间:2015/09/02
多语言声学建模  语种移植  关键词检测  Multilingual Acoustic Modeling  Cross Language Transfer  Key-word Spotting  
基于计算听觉场景分析的单声道混合语音分离研究 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2007
作者:  李鹏
Adobe PDF(1867Kb)  |  收藏  |  浏览/下载:294/0  |  提交时间:2015/09/02
单声道语音分离  计算听觉场景分析  二值掩蔽  语音客观质量评估  多基音跟踪  因子最大矢量量化  Monaural Speech Separation  Computational Auditory Scene Analysis  Binary Mask  Objective Quality Assessment Of Speech  Multi-pitch Tracking  Factorial-max Vector Quantization