CASIA OpenIR  > 毕业生  > 硕士学位论文
语音识别中的汉语口音自适应问题研究
刘明宽
Subtype工学硕士
Thesis Advisor黄泰翼 ; 徐波
2000-06-01
Degree Grantor中国科学院自动化研究所
Place of Conferral中国科学院自动化研究所
Degree Discipline模式识别与智能系统
Keyword语音识别 自适应 发音字典 地方口音
Abstract虽然近十多年来,语音识别研究在大词汇量、非特定人、连续语音 识别(LVCSR)上取得了巨大进展,在一般的办公环境下对标准语音和规 范新闻类语料的识别已可达到90%以上。但是目前的语音识别技术同人类 的听觉能力相比还相差很远。以目前的LVCSR系统为例,它除了对不同听 写领域、环境噪声高度敏感外,还对说话人的发音有着相当严格的要求。 当说话人发音不太标准或者带一些口音时,系统性能就会急剧下降。因此 解决语音识别中说话人的口音自适应问题成为了语音识别实用化最迫切 的研究课题之一。 根据音位学上的观点,不同人之间的发音差别可以分为两类:一类 发音差别属于同一音位的不同音素变体之间的差别;而另一类发音差别则 完全是由一个音位变化到另外一个完全不同的音位,这种差别构成了区分 功能上的对立。以上两种发音差别都存在于地方口音同标准普通话发音之 间的发音差异中。本文认为对于第一种发音差异可以通过在声学模型层对 模型参数进行调整的方法如MAP或MLLR等算法来实现自适应。而对于第 二种发音差异,则可以通过发音字典自适应的方法比较有效地实现口音自适应。 本文以大词汇量、非特定人、连续语音识别为背景,以隐马尔可夫 模型为基本框架,从发音字典自适应的角度详细探讨分析了汉语连续语音 识别中的地方口音自适应问题。在论文里详细讨论了如何利用发音建模技 术来建立反映地方口音发音变化的音节发音变异词典的过程,并进一步提 出了上下文相关发音字典的概念,进而探讨了如何在识别系统中应用这些 信息的理论框架。在本文的最后总结出了一套比较实用的说话人地方口音 自适应方案,为今后在这方面的进一步研究开发工作奠定了基础。
shelfnumXWLW577
Other Identifier577
Language中文
Document Type学位论文
Identifierhttp://ir.ia.ac.cn/handle/173211/7310
Collection毕业生_硕士学位论文
Recommended Citation
GB/T 7714
刘明宽. 语音识别中的汉语口音自适应问题研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,2000.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[刘明宽]'s Articles
Baidu academic
Similar articles in Baidu academic
[刘明宽]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[刘明宽]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.