CASIA OpenIR  > 毕业生  > 硕士学位论文
表格分析和自动处理
章海涛
学位类型工学硕士
导师刘迎建
2000-06-01
学位授予单位中国科学院自动化研究所
学位授予地点中国科学院自动化研究所
学位专业模式识别与智能系统
摘要表格处理是文本分析和处理中一个重要的组成部分,其研究领域大致可分 成两类:表格版面分析和填入数据提取。本文的研究主要集中在表格版面分析 和表格自动处理系统上。 本文介绍了一种基于直线提取和补全的表格分析方法。先使用一种游程跟 踪的直线提取算法求得表格线,同时对表格进行倾斜校正。然后根据表格特性 调整表格线,再从表格线得到表格特征点,最后建立规则通过对表格线的补全 来求得表格结构的行单元描述。此方法取得了良好的实验结果。 本论文还介绍了一个工商局表格处理系统。此系统由表格描述、表格识别、 表格注册、数据提取和识别等步骤组成。该系统在济南和珠海工商局得到成功 应用。
其他摘要Form processing is an important part in the research of document analysis and recognition. There are mainly two research areas in form processing: form layout analysis and filled-in data extraction. In this paper, our research work focuses on form layout analysis and automatic form processing system. This paper presents a form analysis method based on line extraction and completion. We use a run-length tracking algorithm to extract form lines first, and in the same time the skew angle is detected. Lines are adjusted according to the characteristic of form. Then all critical points are calculated from which tbrm cell description of the form can be derived based on some rules to complete the form lines. This method shows good result in experiment. This paper also describes an automatic form processing system for Business Administration Office. The system consists of form description, form classification, form registration, data extraction and recognition. This system has been successfully applied in Jinan and Zhuhai Business Administration Office.
馆藏号XWLW557
其他标识符557
语种中文
文献类型学位论文
条目标识符http://ir.ia.ac.cn/handle/173211/7289
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
章海涛. 表格分析和自动处理[D]. 中国科学院自动化研究所. 中国科学院自动化研究所,2000.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[章海涛]的文章
百度学术
百度学术中相似的文章
[章海涛]的文章
必应学术
必应学术中相似的文章
[章海涛]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。