CASIA OpenIR  > 毕业生  > 硕士学位论文
面向问题求解的人机口语对话系统中语音识别器的研究
徐鹏
Subtype工学硕士
Thesis Advisor黄泰翼
1998-06-01
Degree Grantor中国科学院自动化研究所
Place of Conferral中国科学院自动化研究所
Degree Discipline模式识别与智能系统
Keyword人机口语对话系统 语音识别器 N-gram语言模型 Bigram 音节填充模型 垃圾模型 Viterbi-beam搜索
Abstract随着计算机技术的发展和人们对人机接口智能化的要求,基于 语音的人机接口技术越来越受到人们的重视。而在这一技术当中,口 语的识别和理解是最关键的部分,要建立一个非特定人、大词汇量的 口语人机对话系统,就必须解决口语的识别和理解问题。 本文结合了我们开发的一个基于问题求解的人机口语对话系 统,介绍我们最近在口语的识别问题上所做的工作,并且给出了我们 构造的语音识别器在实际系统中的性能。 针对汉语的特点和我们实验室多年来在汉语语音识别方面的研 究成果,我们采用了细化的声韵母作为声学建模单元,并采用了连续 概率密度的HMM。我们的研究表明,这种建模方法所能达到的声学 识别率略好于其它的一些方法。 根据旅游信息获取这一主题,我们收集了一批语料,建立了141∈ 词的词典。在识别方面,为了处理口语中旬子灵活多变的特点,我们 采用了大词汇量语音识别系统中常用的基于词树的Viterbi.Beam搜 索算法,并且采用语言模型来引导搜索过程。由于语料的限制,我们 采用了基于词类的N-Gram语言模型,在实际中使用Bigram。考虑 到口语中集外词现象非常普遍,我们引入了音节填充模型,用于处理 集外词的现象,取得了一定的效果。另外,我们还尝试建立了垃圾模 型,尝试了把垃圾模型与原来的声韵母模型结合在一起的方法,为以 后处理口语中的无意义语声和非语声创造了条件。 我们使用不同的测试集对语音识别器进行了测试。测试结果表 明,无论是训练集内部还是外部的句子,能够达到的字的识别率和关 键词的识别率都大于90%,满足了我们对系统设计的要求。
shelfnumXWLW473
Other Identifier473
Language中文
Document Type学位论文
Identifierhttp://ir.ia.ac.cn/handle/173211/7225
Collection毕业生_硕士学位论文
Recommended Citation
GB/T 7714
徐鹏. 面向问题求解的人机口语对话系统中语音识别器的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1998.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[徐鹏]'s Articles
Baidu academic
Similar articles in Baidu academic
[徐鹏]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[徐鹏]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.