CASIA OpenIR  > 毕业生  > 硕士学位论文
语音识别中的汉语口音自适应问题研究
刘明宽
学位类型工学硕士
导师黄泰翼 ; 徐波
2000-06-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词语音识别 自适应 发音字典 地方口音
摘要虽然近十多年来,语音识别研究在大词汇量、非特定人、连续语音 识别(LVCSR)上取得了巨大进展,在一般的办公环境下对标准语音和规 范新闻类语料的识别已可达到90%以上。但是目前的语音识别技术同人类 的听觉能力相比还相差很远。以目前的LVCSR系统为例,它除了对不同听 写领域、环境噪声高度敏感外,还对说话人的发音有着相当严格的要求。 当说话人发音不太标准或者带一些口音时,系统性能就会急剧下降。因此 解决语音识别中说话人的口音自适应问题成为了语音识别实用化最迫切 的研究课题之一。 根据音位学上的观点,不同人之间的发音差别可以分为两类:一类 发音差别属于同一音位的不同音素变体之间的差别;而另一类发音差别则 完全是由一个音位变化到另外一个完全不同的音位,这种差别构成了区分 功能上的对立。以上两种发音差别都存在于地方口音同标准普通话发音之 间的发音差异中。本文认为对于第一种发音差异可以通过在声学模型层对 模型参数进行调整的方法如MAP或MLLR等算法来实现自适应。而对于第 二种发音差异,则可以通过发音字典自适应的方法比较有效地实现口音自适应。 本文以大词汇量、非特定人、连续语音识别为背景,以隐马尔可夫 模型为基本框架,从发音字典自适应的角度详细探讨分析了汉语连续语音 识别中的地方口音自适应问题。在论文里详细讨论了如何利用发音建模技 术来建立反映地方口音发音变化的音节发音变异词典的过程,并进一步提 出了上下文相关发音字典的概念,进而探讨了如何在识别系统中应用这些 信息的理论框架。在本文的最后总结出了一套比较实用的说话人地方口音 自适应方案,为今后在这方面的进一步研究开发工作奠定了基础。
馆藏号XWLW577
其他标识符577
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7310
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
刘明宽. 语音识别中的汉语口音自适应问题研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,2000.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[刘明宽]的文章
百度学术
百度学术中相似的文章
[刘明宽]的文章
必应学术
必应学术中相似的文章
[刘明宽]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。