CASIA OpenIR  > 毕业生  > 硕士学位论文
基于隐马尔可夫模型的鲁棒性语音识别研究
姚磊
学位类型工学硕士
导师黄泰翼
1996-07-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
摘要随着计算机技术的发展,当今社会信息化、自动化要求的不 断提高, 人们越来越渴望与计算机直接进行语言交流。然而, 人 机语音通信虽然在实验室条件下取得了可喜的成果,在实际应用 中却困难重重。这主要是因为,实际应用条件往往与训练条件不 匹配,此时,大部分语音识别系统的性能会急剧下降。即当前的 语音识别系统普遍缺乏鲁棒性。 本文针对鲁棒性语音识别开展研究,首先,试图寻找鲁棒性 的语音特征参数,考虑到人类听觉对噪声语音极强的识别能 力,我们在语音信号的参数表示中引入人类的听觉模型,构造了 MFC倒谱和MPC倒谱,并比较了MFC倒谱与LPC倒谱在噪声环境 下的鲁棒性能。结果表明,虽然MFC倒谱对含噪语音,比LPC倒谱 有更高的识别率,但是,这个识别率仍然远远低于它对干净语音 的识别率。 由于目前找不到真正具有鲁棒性的语音特征参数,我们制定 了另一种切实可行的鲁棒性语音识别策略:根据测试条件与训练 条件各种不匹配情况对语音信号的影响,采用自适应方法消除测 试语音和训练语音的差异,使测试语音适应于识剐系统,获得较 高的识别率。同时,我们将测试条件于训练条件的不匹配简单地 划分为三类:讲话者的不同,录音通道的变化,以及噪声环境的 影响。基于上述策略,我们认为通道对语音信号的影响相当于一 个慢变的线性系统,它的特性可以用一个传输函数来表示,由 此,我们研究和改进了倒谱归一化技术和RASTA技术,来滤除语 音信号中的通道成分,加强语音识别系统对通道的鲁棒性。常见 噪声信号的特性是:加性、平稳、与语音信号不相关。据此,我们 研究了利用谱减技术和LIN-LOGRASTA技术来提高含噪语音信号 中的信噪比,从而提高语音识别系统对含噪语音的识别率。在上 述对通道和加性噪声自适应算法研究的基础上,我们提出了两种 能够补偿所有测试条件与训练条件不匹配情况的通用自适应方 法:基于正则相关分析的谱变换补偿法(CCBC)和基于SCHMM训练 的VQ码本自适应法。并设计了五种典型的测试集与训练集不匹 配情况,对两种通用自适应算法的有效性进行检验.结果表 明,它们对所有五种不匹配情况都有良好的补偿效果.最后,我 们根据CCBC方法的特点,提出将其作为一种在线自适应技术.
馆藏号XWLW398
其他标识符398
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7169
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
姚磊. 基于隐马尔可夫模型的鲁棒性语音识别研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[姚磊]的文章
百度学术
百度学术中相似的文章
[姚磊]的文章
必应学术
必应学术中相似的文章
[姚磊]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。