| 结合时长信息的HMM研究及其在汉语连续数字语音识别系统中的应用 |
| 黄超
|
| 1996-06-01
|
学位类型 | 工学硕士
|
中文摘要 | 连续数字的语音识别在现实中具有十分的意义,诸如电话语音 拨号,身份证号码证实, 自动数据录入,数据校对等,尽管英文 数字的识别已达到了相当高的识别率, 但汉语由于其独特的特 点, 目前,识别性能仍不理想。 在致力于提高系统识别性能的同时,我们提出了一系列的改进 措施:在参数表示中加进了差分及高阶差分信息等动态特征,从 而提供了关于参数在时域和频域的比较全面的二元描述; 尤其 是关于时长信息的引入及其相应的训练、识别算法,一方面改进 了传统HMM在这方面建模的不足,具有普遍的应用价值,其次显 著提高了系统的识别性能,对插入和删除错误具有明显的改善; 在非特定人的识别中, 除了进行时长自适应以便加强时长对不 定人的建模能力外,还尝试了说话人聚类, 即对不同类别分开建 模的方法; 为了利用上下文的信息,进行了考虑上下文影响的字 建模,取得了一定的效果;在研制系统中,还设计了一套全面平 衡各种统计特征的特定人及非特定人的汉语连续数字库及一套 对识别结果进行自动统计分析、分类的程序,为快捷准确地分析 错误来源,从而采取相应的改进措施提供了客观的依据。 最后,在综合上述措施、方法的基础上,建立了一个’Windows下的 汉语连续数字语音识别口呼系统,在不依赖任何加速板卡的条 件下, 即从特征提取到识别均在奔腾586/100上完成,达到实时识 别,在计人数字1的两种读音/yi/和/yiao/情形下,取得了较理想的 识别效果。 最后值得说明的是,尽管上述方法是针对数字识别任务提出的, 但是几乎所有的方案, 如动态特征、时长信息、 说话人聚类、 上 下文建模等均具有普遍的推广意义, 即可直接应用于其它识别 任务中。 |
语种 | 中文
|
文献类型 | 学位论文
|
条目标识符 | http://ir.ia.ac.cn/handle/173211/7152
|
专题 | 毕业生_硕士学位论文
|
推荐引用方式 GB/T 7714 |
黄超. 结合时长信息的HMM研究及其在汉语连续数字语音识别系统中的应用[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,1996.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论