CASIA OpenIR  > 毕业生  > 博士学位论文
基于数据挖掘的脱机手写汉字识别方法的研究
镇立新
2000-06-01
学位类型工学博士
中文摘要汉字样本库以及汉字识别训练与识别中产生的中间结果都可视为一种数据 库,如何有效地分析和利用这些数据从中获得有价值的信息是一个值得研究的 问题,本文的工作正是从这个角度,将数据挖掘(Data Mining)和知识发现 (KDD)的某些思想和方法结合到脱机手写汉字识别的研究中。主要工作有以 下几个方面: · 在综合集成的思想框架下,研究了数据挖掘的系统模型,提出了作为开 放智能系统的数据挖掘模型。 · 提出了一种新的聚类算法--关联类别聚类(ACG),该算法能够有效 发现汉之中的相似字,并根据识别系统的不同需求将相似字聚为互不相 交的子类,为解决汉字识别的难点之一,相似字的区分提供了一种方法。 · 提出了分类器可分子集划分的概念,并设计了两种划分算法--贪心划 分算法和随机划分算法。分类器可分子集划分的概念,为分类器的串行 集成提供了具体的指导和支持,它同时也是分类器评价的一种方法。 · 将关联规则挖掘用于多分类器的集成,其中关联规则作为分类器的行为 规则表示。并设计了发现算法和剪枝算法,该方法有别于传统的集成方 法,可以说是一种基于知识的集成方法。 · 在关联类别聚类和分类器可分子集划分的基础上,实现了一种基于神经 网络预分集成汉字识别系统。 本文的工作富于创新,并取得了一些成果。
关键词手写汉字识别 数据挖掘 分类器集成 关联规则 聚类
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/5709
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
镇立新. 基于数据挖掘的脱机手写汉字识别方法的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,2000.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[镇立新]的文章
百度学术
百度学术中相似的文章
[镇立新]的文章
必应学术
必应学术中相似的文章
[镇立新]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。