| 基于数据挖掘的脱机手写汉字识别方法的研究 |
| 镇立新
|
| 2000-06-01
|
学位类型 | 工学博士
|
中文摘要 | 汉字样本库以及汉字识别训练与识别中产生的中间结果都可视为一种数据 库,如何有效地分析和利用这些数据从中获得有价值的信息是一个值得研究的 问题,本文的工作正是从这个角度,将数据挖掘(Data Mining)和知识发现 (KDD)的某些思想和方法结合到脱机手写汉字识别的研究中。主要工作有以 下几个方面: · 在综合集成的思想框架下,研究了数据挖掘的系统模型,提出了作为开 放智能系统的数据挖掘模型。 · 提出了一种新的聚类算法--关联类别聚类(ACG),该算法能够有效 发现汉之中的相似字,并根据识别系统的不同需求将相似字聚为互不相 交的子类,为解决汉字识别的难点之一,相似字的区分提供了一种方法。 · 提出了分类器可分子集划分的概念,并设计了两种划分算法--贪心划 分算法和随机划分算法。分类器可分子集划分的概念,为分类器的串行 集成提供了具体的指导和支持,它同时也是分类器评价的一种方法。 · 将关联规则挖掘用于多分类器的集成,其中关联规则作为分类器的行为 规则表示。并设计了发现算法和剪枝算法,该方法有别于传统的集成方 法,可以说是一种基于知识的集成方法。 · 在关联类别聚类和分类器可分子集划分的基础上,实现了一种基于神经 网络预分集成汉字识别系统。 本文的工作富于创新,并取得了一些成果。 |
关键词 | 手写汉字识别
数据挖掘
分类器集成
关联规则
聚类
|
语种 | 中文
|
文献类型 | 学位论文
|
条目标识符 | http://ir.ia.ac.cn/handle/173211/5709
|
专题 | 毕业生_博士学位论文
|
推荐引用方式 GB/T 7714 |
镇立新. 基于数据挖掘的脱机手写汉字识别方法的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,2000.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论