Hybrid Page Segmentation with Efficient Whitespace Rectangles Extraction and Grouping
Chen, Kai; Yin, Fei; Liu, Cheng-Lin
2013-08
会议名称2013 12TH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR)
会议录名称International Conference on Document Analysis and Recognition (ICDAR)
页码958-962
会议日期2013-8
会议地点美国华盛顿
摘要Page segmentation is still a challenging problem due
to the large variety of document layouts. Methods examining both
foreground and background regions are among the most effective
to solve this problem. However, their performance is influenced
by the implementation of two key steps: the extraction and
selection of background regions, and the grouping of background
regions into separators. This paper proposes an efficient hybrid
method for page segmentation. The method extracts whitespace
rectangles based on connected component analysis, and filters
whitespace rectangles progressively incorporating foreground and
background information such that the remaining rectangles are
likely to form column separators. Experimental results on the
ICDAR2009 page segmentation competition test set demonstrate
the effectiveness and superiority of the proposed method.
关键词Page Segmentation Whitespace Rectangles Extraction Whitespace Rectangles Grouping
收录类别EI
文献类型会议论文
条目标识符http://ir.ia.ac.cn/handle/173211/4377
专题多模态人工智能系统全国重点实验室_模式分析与学习
通讯作者Chen, Kai
作者单位中科院自动化研究所
第一作者单位中国科学院自动化研究所
通讯作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
Chen, Kai,Yin, Fei,Liu, Cheng-Lin. Hybrid Page Segmentation with Efficient Whitespace Rectangles Extraction and Grouping[C],2013:958-962.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
Hybrid_Page_Chen.pdf(750KB)会议论文 开放获取CC BY-NC-SA浏览
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[Chen, Kai]的文章
[Yin, Fei]的文章
[Liu, Cheng-Lin]的文章
百度学术
百度学术中相似的文章
[Chen, Kai]的文章
[Yin, Fei]的文章
[Liu, Cheng-Lin]的文章
必应学术
必应学术中相似的文章
[Chen, Kai]的文章
[Yin, Fei]的文章
[Liu, Cheng-Lin]的文章
相关权益政策
暂无数据
收藏/分享
文件名: Hybrid_Page_Chen.pdf
格式: Adobe PDF
此文件暂不支持浏览
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。