已选(0)清除
条数/页: 排序方式: |
| 感知线索辅助的语音分离技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 郝云喆 Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:342/16  |  提交时间:2022/06/23 鸡尾酒会问题 语音分离 声纹线索 起止线索 多感知线索 |
| 语音合成声学建模技术研究 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 王文富 Adobe PDF(4177Kb)  |  收藏  |  浏览/下载:440/8  |  提交时间:2018/06/07 语音合成 声学建模 门控循环混合密度网络 卷积输出层 对抗学习 端到端 |
| 面向语种识别的深度神经网络建模方法研究 学位论文 , 北京: 中国科学院研究生院, 2017 作者: 耿旺 Adobe PDF(5822Kb)  |  收藏  |  浏览/下载:518/9  |  提交时间:2017/07/06 语种识别 神经网络模型 总体差异空间建模 注意力模型 端到端 |
| 基于深度学习的语音识别声学模型建模方法研究 学位论文 , 北京: 中国科学院研究生院, 2016 作者: 李杰 Adobe PDF(5438Kb)  |  收藏  |  浏览/下载:588/14  |  提交时间:2016/06/23 深度学习 语音识别 声学模型建模 |
| 电话信道下说话人分离及识别研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2013 作者: 张策 Adobe PDF(1685Kb)  |  收藏  |  浏览/下载:397/0  |  提交时间:2015/09/02 说话人识别 说话人分离 因子分析 高斯混合模型 贝叶斯分析 Speaker Recognition Speaker Diarization Factor Analysis Gaussian Mixture Models Bayesian Analysis |
| 面向英语口语测试的发音错误检测和诊断技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2011 作者: 李宏言 Adobe PDF(2351Kb)  |  收藏  |  浏览/下载:382/2  |  提交时间:2015/09/02 发音错误检测 发音诊断 大人群口语测试 分类器模型 时长模型 错误规则网络 重音错误检测 Mispronunciation Detection Mispronunciation Diagnosis Large Scale Spoken Language Test Classifier Model Duration Model Mispronunciation Rule Network Stress Mispronunciation Detection |
| 口语测试自动评估技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2009 作者: 江杰 Adobe PDF(1431Kb)  |  收藏  |  浏览/下载:230/0  |  提交时间:2015/09/02 口语自动评估 二次多模型强制切分 增强后验概率向量 文本相似度计算 向量空间模型 Automatic Language Proficiency Evaluation Two Time Force Alignment With Multi-models Enhanced Posterior Probability Vector Text Similarity Calculation Vector Space Model |
| 基于数据聚类的语言建模研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2008 作者: 王晓瑞 Adobe PDF(1198Kb)  |  收藏  |  浏览/下载:173/0  |  提交时间:2015/09/02 层次化词类语言模型 随机森林语言模型 语言模型自适应 语音识别结果纠错 Hierarchical Class Language Model Random Forest Language Model Language Model Adaptation Speech Recognition Error Correction |
| 基于计算听觉场景分析的单声道混合语音分离研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2007 作者: 李鹏 Adobe PDF(1867Kb)  |  收藏  |  浏览/下载:308/0  |  提交时间:2015/09/02 单声道语音分离 计算听觉场景分析 二值掩蔽 语音客观质量评估 多基音跟踪 因子最大矢量量化 Monaural Speech Separation Computational Auditory Scene Analysis Binary Mask Objective Quality Assessment Of Speech Multi-pitch Tracking Factorial-max Vector Quantization |
| 连续音频流环境下的说话人检测技术 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2006 作者: 白俊梅 Adobe PDF(598Kb)  |  收藏  |  浏览/下载:216/0  |  提交时间:2015/09/02 说话人检测 二级音频切分 Gmm F0相关图 说话人分类 Speaker Detection Two-pass Audio Segmentation Gmm Pitch Correlogram Speaker Classfication |