CASIA OpenIR  > 毕业生  > 硕士学位论文
面向问题求解的人机口语对话系统中语音识别器的研究
徐鹏
学位类型工学硕士
导师黄泰翼
1998-06-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
关键词人机口语对话系统 语音识别器 N-gram语言模型 Bigram 音节填充模型 垃圾模型 Viterbi-beam搜索
摘要随着计算机技术的发展和人们对人机接口智能化的要求,基于 语音的人机接口技术越来越受到人们的重视。而在这一技术当中,口 语的识别和理解是最关键的部分,要建立一个非特定人、大词汇量的 口语人机对话系统,就必须解决口语的识别和理解问题。 本文结合了我们开发的一个基于问题求解的人机口语对话系 统,介绍我们最近在口语的识别问题上所做的工作,并且给出了我们 构造的语音识别器在实际系统中的性能。 针对汉语的特点和我们实验室多年来在汉语语音识别方面的研 究成果,我们采用了细化的声韵母作为声学建模单元,并采用了连续 概率密度的HMM。我们的研究表明,这种建模方法所能达到的声学 识别率略好于其它的一些方法。 根据旅游信息获取这一主题,我们收集了一批语料,建立了141∈ 词的词典。在识别方面,为了处理口语中旬子灵活多变的特点,我们 采用了大词汇量语音识别系统中常用的基于词树的Viterbi.Beam搜 索算法,并且采用语言模型来引导搜索过程。由于语料的限制,我们 采用了基于词类的N-Gram语言模型,在实际中使用Bigram。考虑 到口语中集外词现象非常普遍,我们引入了音节填充模型,用于处理 集外词的现象,取得了一定的效果。另外,我们还尝试建立了垃圾模 型,尝试了把垃圾模型与原来的声韵母模型结合在一起的方法,为以 后处理口语中的无意义语声和非语声创造了条件。 我们使用不同的测试集对语音识别器进行了测试。测试结果表 明,无论是训练集内部还是外部的句子,能够达到的字的识别率和关 键词的识别率都大于90%,满足了我们对系统设计的要求。
馆藏号XWLW473
其他标识符473
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7225
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
徐鹏. 面向问题求解的人机口语对话系统中语音识别器的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1998.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[徐鹏]的文章
百度学术
百度学术中相似的文章
[徐鹏]的文章
必应学术
必应学术中相似的文章
[徐鹏]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。