CASIA OpenIR  > 毕业生  > 硕士学位论文
可信度度量及其在高性能语音识别中的应用
邓勇刚
学位类型工学硕士
导师黄泰翼 ; 徐波
2000-06-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
摘要统计模型的引入使得语音识别得以极大的发展,然而仍然面临着鲁棒性、集外词、可 信度度量等挑战,本论文主要针对于鲁棒、高效、实用的语音识别器,从前端处理、声 学模型、韵律模型、搜索策略、识别结果评估等方面,结合掌上机开放命令识别任务和 非特定人连续汉语数字串识别任务,探讨了搭建一个高效、可靠的语音识别系统的有关 核心算法和关键技术,研究重点是如何定义和应用可信度度量提高系统的性能。 本文定义了什么是可信度度量,探讨了可信度在语音识别中可能的应用,然后分析了 在可信度方面开展过的研究工作,重点是话语校验、关键词检测和集外词探测等三方面 的应用。 针对于掌上机开放命令识别任务,我们设计并实现了简单、灵活和完善的应用程序接 口;提出了高效、鲁棒、可配置的基于时域能量的端点检测算法;比较了不同的特征对 识别器性能的影响,定点和浮点算法对训练和识别速度的影响,比较结果表明采用LPC 倒谱参数可以达到最佳性能,而精心设计的定点实现算法在保证同样识别性能前提下, 能大大提高响应速度;对于集外词拒识,我们提出并实现了基于神经网络的多可信度综 合判决方法,定义了多个来源于声学似然得分和韵律匹配结果的规一化的多可信度指标, 作为输入特征,这些评估指标公平的在神经网络中相互竞争,综合判决,避免了简单、 敏感的门限策略。 识别率体现了系统的可靠程度,识别率越高,识别器的可信度越高。对于非特定人连 续汉语数字串识别任务,我们分析了汉语数字串识别的难点所在,从训练到识别的各个 环节,采取了一系列措施,最终实现了一个高性能、实用化的连续汉语数字串识别研发 系统。我们设计了特定于数字串的问题集,实现了基于决策树的三音子模型;提出新的 隶属度计算公式,实现了模糊聚类算法;提出了上下文无关的高斯混合时长模型,混合 系数由最大似然准则自动确定;实现了基于三音子模型的Viterbi解码算法和词图上的A* 搜索算法,定量的评估了三音子模型和时长模型对识别器性能提高的贡献。结果表明, 两者分别独立的使得识别器平均串误识率下降33.4%和18.7%。为了进一步提高识别器性 能,我们尝试了根据最小分类错误准则实现区分训练算法,以提高声学模型的精度。初 步试验结果表明对识别器性能有所改善。
馆藏号XWLW576
其他标识符576
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7309
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
邓勇刚. 可信度度量及其在高性能语音识别中的应用[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,2000.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[邓勇刚]的文章
百度学术
百度学术中相似的文章
[邓勇刚]的文章
必应学术
必应学术中相似的文章
[邓勇刚]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。