基于隐马尔可夫模型的鲁棒性语音识别研究

CASIA OpenIR > 毕业生 > 硕士学位论文

	基于隐马尔可夫模型的鲁棒性语音识别研究
	姚磊
	1996-07-01
学位类型	工学硕士
中文摘要	随着计算机技术的发展，当今社会信息化、自动化要求的不断提高，人们越来越渴望与计算机直接进行语言交流。然而，人机语音通信虽然在实验室条件下取得了可喜的成果，在实际应用中却困难重重。这主要是因为，实际应用条件往往与训练条件不匹配，此时，大部分语音识别系统的性能会急剧下降。即当前的语音识别系统普遍缺乏鲁棒性。本文针对鲁棒性语音识别开展研究，首先，试图寻找鲁棒性的语音特征参数，考虑到人类听觉对噪声语音极强的识别能力，我们在语音信号的参数表示中引入人类的听觉模型，构造了 MFC倒谱和MPC倒谱，并比较了MFC倒谱与LPC倒谱在噪声环境下的鲁棒性能。结果表明，虽然MFC倒谱对含噪语音，比LPC倒谱有更高的识别率，但是，这个识别率仍然远远低于它对干净语音的识别率。由于目前找不到真正具有鲁棒性的语音特征参数，我们制定了另一种切实可行的鲁棒性语音识别策略：根据测试条件与训练条件各种不匹配情况对语音信号的影响，采用自适应方法消除测试语音和训练语音的差异，使测试语音适应于识剐系统，获得较高的识别率。同时，我们将测试条件于训练条件的不匹配简单地划分为三类：讲话者的不同，录音通道的变化，以及噪声环境的影响。基于上述策略，我们认为通道对语音信号的影响相当于一个慢变的线性系统，它的特性可以用一个传输函数来表示，由此，我们研究和改进了倒谱归一化技术和RASTA技术，来滤除语音信号中的通道成分，加强语音识别系统对通道的鲁棒性。常见噪声信号的特性是：加性、平稳、与语音信号不相关。据此，我们研究了利用谱减技术和LIN-LOGRASTA技术来提高含噪语音信号中的信噪比，从而提高语音识别系统对含噪语音的识别率。在上述对通道和加性噪声自适应算法研究的基础上，我们提出了两种能够补偿所有测试条件与训练条件不匹配情况的通用自适应方法：基于正则相关分析的谱变换补偿法(CCBC)和基于SCHMM训练的VQ码本自适应法。并设计了五种典型的测试集与训练集不匹配情况，对两种通用自适应算法的有效性进行检验．结果表明，它们对所有五种不匹配情况都有良好的补偿效果．最后，我们根据CCBC方法的特点，提出将其作为一种在线自适应技术．
语种	中文
文献类型	学位论文
条目标识符	http://ir.ia.ac.cn/handle/173211/7169
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	姚磊. 基于隐马尔可夫模型的鲁棒性语音识别研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.