CASIA OpenIR  > 毕业生  > 硕士学位论文
汉语非特定人连续语音识别系统的研究与实现
高强
学位类型工学硕士
导师黄泰翼
1996-07-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
摘要随着计算机技术的发展,人们对计算机人机接口的智能化程度 要求越来越高.语音识别作为一种最自然的人机对话手段正越来越 受到人们的关注非特定人,大词汇量,连续语音和自然的说话方式 是目前语音识别的研究重点和发展方向,也是语音识别走向实用化 的关键国外已经在实验室研制成功了以听写机为应用背景的2万 词书面语连续语音识别系统和以民航信息查询为应用背景的口语 识别系统。 针对汉语语音识别,国内一些单位也已做了有益的工 作。 本文则介绍了我们实现的一个1004词汉语非特定人连续语音识 别系统。 它针对北京市旅游信息咨询这一任务领域, 采用 HMM/VQ, 有限状态文法和Viterbi Beam搜索为核心技术, 以语音组 建立的60男+60女语音数据库作为非特定人的训练数据。系统采用细 化的声韵母作为最基本的声学建模单元, 针对汉语中韵母比声母 容易识别的特点, 将Viterbi Beam搜索的方向取成时间上的逆序, 即 从一句话的结束处向开始处搜索。 由于汉语音节总是声母在前, 韵 母在后的结构, 逆序的搜索方向使得搜索总是从容易识别的韵母 而不是从难识别的声母开始, 从而降低了Viterbi Beam搜索开始时剪 裁掉最优解的风险。 在搜索的剪裁策略等方面我们也做了各种比 较,获得了有益的结果。通过将句子的语义信息嵌入在搜索的语法 网络中, 本系统对识别的句子具有理解功能。 作为中国科学院“八五”重大科研项目“汉语全部单音节的识 别和合成及非特定人语音识别”课题的一部分, 本系统在国内率 先将非特定人,连续语音和大词汇量(1000词以上)综合考虑进行了 研究。经项目鉴定委员会的评审,在语言模型Perplexity为20的情况, 词识别率达到95%(数据库和现场口呼形式测试),认为处于国内领 先,达到国际先进水平。为以后汉语非特定人连续语音识别的进一 步研究打下了一个良好的基础。
馆藏号XWLW393
其他标识符393
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7164
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
高强. 汉语非特定人连续语音识别系统的研究与实现[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[高强]的文章
百度学术
百度学术中相似的文章
[高强]的文章
必应学术
必应学术中相似的文章
[高强]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。