CASIA OpenIR  > 毕业生  > 硕士学位论文
基于隐马尔可夫模型的鲁棒性语音识别研究
姚磊
Subtype工学硕士
Thesis Advisor黄泰翼
1996-07-01
Degree Grantor中国科学院自动化研究所
Place of Conferral中国科学院自动化研究所
Degree Discipline模式识别与智能系统
Abstract随着计算机技术的发展,当今社会信息化、自动化要求的不 断提高, 人们越来越渴望与计算机直接进行语言交流。然而, 人 机语音通信虽然在实验室条件下取得了可喜的成果,在实际应用 中却困难重重。这主要是因为,实际应用条件往往与训练条件不 匹配,此时,大部分语音识别系统的性能会急剧下降。即当前的 语音识别系统普遍缺乏鲁棒性。 本文针对鲁棒性语音识别开展研究,首先,试图寻找鲁棒性 的语音特征参数,考虑到人类听觉对噪声语音极强的识别能 力,我们在语音信号的参数表示中引入人类的听觉模型,构造了 MFC倒谱和MPC倒谱,并比较了MFC倒谱与LPC倒谱在噪声环境 下的鲁棒性能。结果表明,虽然MFC倒谱对含噪语音,比LPC倒谱 有更高的识别率,但是,这个识别率仍然远远低于它对干净语音 的识别率。 由于目前找不到真正具有鲁棒性的语音特征参数,我们制定 了另一种切实可行的鲁棒性语音识别策略:根据测试条件与训练 条件各种不匹配情况对语音信号的影响,采用自适应方法消除测 试语音和训练语音的差异,使测试语音适应于识剐系统,获得较 高的识别率。同时,我们将测试条件于训练条件的不匹配简单地 划分为三类:讲话者的不同,录音通道的变化,以及噪声环境的 影响。基于上述策略,我们认为通道对语音信号的影响相当于一 个慢变的线性系统,它的特性可以用一个传输函数来表示,由 此,我们研究和改进了倒谱归一化技术和RASTA技术,来滤除语 音信号中的通道成分,加强语音识别系统对通道的鲁棒性。常见 噪声信号的特性是:加性、平稳、与语音信号不相关。据此,我们 研究了利用谱减技术和LIN-LOGRASTA技术来提高含噪语音信号 中的信噪比,从而提高语音识别系统对含噪语音的识别率。在上 述对通道和加性噪声自适应算法研究的基础上,我们提出了两种 能够补偿所有测试条件与训练条件不匹配情况的通用自适应方 法:基于正则相关分析的谱变换补偿法(CCBC)和基于SCHMM训练 的VQ码本自适应法。并设计了五种典型的测试集与训练集不匹 配情况,对两种通用自适应算法的有效性进行检验.结果表 明,它们对所有五种不匹配情况都有良好的补偿效果.最后,我 们根据CCBC方法的特点,提出将其作为一种在线自适应技术.
shelfnumXWLW398
Other Identifier398
Language中文
Document Type学位论文
Identifierhttp://ir.ia.ac.cn/handle/173211/7169
Collection毕业生_硕士学位论文
Recommended Citation
GB/T 7714
姚磊. 基于隐马尔可夫模型的鲁棒性语音识别研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[姚磊]'s Articles
Baidu academic
Similar articles in Baidu academic
[姚磊]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[姚磊]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.