Page Segmentation for Historical Handwritten Documents Using Fully Convolutional Networks
Xu Y(徐玥)1,2; He WH(何文浩)1,2; Yin F(殷飞)2; Liu CL(刘成林)1,2
2017
会议名称2017 14th IAPR International Conference on Document Analysis and Recognition
页码541~546
会议日期2017.11.9 - 2017.11.15
会议地点Kyoto, Japan
摘要
Page segmentation is a fundamental and challenging
task in document image analysis due to the layout diversity.
In this work, we propose a pixel-wise segmentation method
for historical handwritten documents using fully convolutional
network (FCN). The document image is segmented into different
regions by classifying pixels into different categories:
background, main text body, comments, and decorations. By
supervised learning on document images with pixel-wise labels,
the FCN can extract discriminative features and perform pixelwise
segmentation accurately. After pixel-wise classification, postprocessing
steps are taken to reduce noises, correct wrong
segmentations and find out overlapping regions. Experimental
results on the public dataset DIVA-HisDB containing challenging
medieval manuscripts demonstrate the effectiveness and superiority
of the proposed method, which yields pixel-level accuracy
of above 99%.
其他摘要版面分割是文档图像分析的基础任务,由于文档版面的多样,版面分割成为非常具有挑战性的任务。在这篇文章中,我们针对古籍手写文档,提出了一种基于全卷积神经网络的像素级的分割算法。通过对像素点进行分类,文档图像被划分为几个不同的区域:背景、正文、旁注以及装饰。通过对文档图像中像素类别的学习,全卷积神经网络可以提取出具有判别性的特征,并生成高准确率的像素级分割结果。在进行像素级的分类后,会进行后处理以减少噪声、更正错误的分割并找出重叠区域。公开数据集DIVA-HisDB包含多种具有挑战性的中世纪手写文档,在这一数据集上我们的算法实验取得了超过99%的准确率,表明了我们算法的准确度和优越性。
关键词Page Segmentation Layout Analysis Fully Convolutional Network
语种英语
文献类型会议论文
条目标识符http://ir.ia.ac.cn/handle/173211/20019
专题模式识别国家重点实验室_模式分析与学习
作者单位1.中国科学院大学
2.中国科学院自动化研究所,模式识别国家重点实验室
推荐引用方式
GB/T 7714
Xu Y,He WH,Yin F,et al. Page Segmentation for Historical Handwritten Documents Using Fully Convolutional Networks[C],2017:541~546.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
Page Segmentation fo(1424KB)会议论文 开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[Xu Y(徐玥)]的文章
[He WH(何文浩)]的文章
[Yin F(殷飞)]的文章
百度学术
百度学术中相似的文章
[Xu Y(徐玥)]的文章
[He WH(何文浩)]的文章
[Yin F(殷飞)]的文章
必应学术
必应学术中相似的文章
[Xu Y(徐玥)]的文章
[He WH(何文浩)]的文章
[Yin F(殷飞)]的文章
相关权益政策
暂无数据
收藏/分享
文件名: Page Segmentation for Historical HandwrittenDocuments Using Fully Convolutional Networks.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。