CASIA OpenIR  > 毕业生  > 硕士学位论文
结合时长信息的HMM研究及其在汉语连续数字语音识别系统中的应用
黄超
学位类型工学硕士
导师陈道文
1996-06-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
摘要连续数字的语音识别在现实中具有十分的意义,诸如电话语音 拨号,身份证号码证实, 自动数据录入,数据校对等,尽管英文 数字的识别已达到了相当高的识别率, 但汉语由于其独特的特 点, 目前,识别性能仍不理想。 在致力于提高系统识别性能的同时,我们提出了一系列的改进 措施:在参数表示中加进了差分及高阶差分信息等动态特征,从 而提供了关于参数在时域和频域的比较全面的二元描述; 尤其 是关于时长信息的引入及其相应的训练、识别算法,一方面改进 了传统HMM在这方面建模的不足,具有普遍的应用价值,其次显 著提高了系统的识别性能,对插入和删除错误具有明显的改善; 在非特定人的识别中, 除了进行时长自适应以便加强时长对不 定人的建模能力外,还尝试了说话人聚类, 即对不同类别分开建 模的方法; 为了利用上下文的信息,进行了考虑上下文影响的字 建模,取得了一定的效果;在研制系统中,还设计了一套全面平 衡各种统计特征的特定人及非特定人的汉语连续数字库及一套 对识别结果进行自动统计分析、分类的程序,为快捷准确地分析 错误来源,从而采取相应的改进措施提供了客观的依据。 最后,在综合上述措施、方法的基础上,建立了一个’Windows下的 汉语连续数字语音识别口呼系统,在不依赖任何加速板卡的条 件下, 即从特征提取到识别均在奔腾586/100上完成,达到实时识 别,在计人数字1的两种读音/yi/和/yiao/情形下,取得了较理想的 识别效果。 最后值得说明的是,尽管上述方法是针对数字识别任务提出的, 但是几乎所有的方案, 如动态特征、时长信息、 说话人聚类、 上 下文建模等均具有普遍的推广意义, 即可直接应用于其它识别 任务中。
馆藏号XWLW382
其他标识符382
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7152
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
黄超. 结合时长信息的HMM研究及其在汉语连续数字语音识别系统中的应用[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[黄超]的文章
百度学术
百度学术中相似的文章
[黄超]的文章
必应学术
必应学术中相似的文章
[黄超]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。