毕业生知识库

图片搜索

粘贴图片网址

CASIA OpenIR > 毕业生 > 硕士学位论文

	汉语非特定人连续语音识别系统的研究与实现
	高强
	1996-07-01
学位类型	工学硕士
中文摘要	随着计算机技术的发展，人们对计算机人机接口的智能化程度要求越来越高．语音识别作为一种最自然的人机对话手段正越来越受到人们的关注非特定人，大词汇量，连续语音和自然的说话方式是目前语音识别的研究重点和发展方向，也是语音识别走向实用化的关键国外已经在实验室研制成功了以听写机为应用背景的2万词书面语连续语音识别系统和以民航信息查询为应用背景的口语识别系统。针对汉语语音识别，国内一些单位也已做了有益的工作。本文则介绍了我们实现的一个1004词汉语非特定人连续语音识别系统。它针对北京市旅游信息咨询这一任务领域，采用 HMM／VQ，有限状态文法和Viterbi Beam搜索为核心技术，以语音组建立的60男+60女语音数据库作为非特定人的训练数据。系统采用细化的声韵母作为最基本的声学建模单元，针对汉语中韵母比声母容易识别的特点，将Viterbi Beam搜索的方向取成时间上的逆序，即从一句话的结束处向开始处搜索。由于汉语音节总是声母在前，韵母在后的结构，逆序的搜索方向使得搜索总是从容易识别的韵母而不是从难识别的声母开始，从而降低了Viterbi Beam搜索开始时剪裁掉最优解的风险。在搜索的剪裁策略等方面我们也做了各种比较，获得了有益的结果。通过将句子的语义信息嵌入在搜索的语法网络中，本系统对识别的句子具有理解功能。作为中国科学院“八五”重大科研项目“汉语全部单音节的识别和合成及非特定人语音识别”课题的一部分，本系统在国内率先将非特定人，连续语音和大词汇量(1000词以上)综合考虑进行了研究。经项目鉴定委员会的评审，在语言模型Perplexity为20的情况，词识别率达到95％(数据库和现场口呼形式测试)，认为处于国内领先，达到国际先进水平。为以后汉语非特定人连续语音识别的进一步研究打下了一个良好的基础。
语种	中文
文献类型	学位论文
条目标识符	http://ir.ia.ac.cn/handle/173211/7164
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	高强. 汉语非特定人连续语音识别系统的研究与实现[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.

条目包含的文件
条目无相关文件。

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[高强]的文章

百度学术

百度学术中相似的文章

[高强]的文章

必应学术

必应学术中相似的文章

[高强]的文章

相关权益政策

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量24467
全文量12297
访问量4999086
下载量797122