Knowledge Commons of Institute of Automation,CAS
叠层模型驱动的书法文字识别方法研究 | |
麻斯亮; 许勇 | |
发表期刊 | 自动化学报 |
ISSN | 0254-4156 |
2024 | |
卷号 | 50期号:5页码:947-957 |
摘要 | 基于二维图像的书法文字识别是指利用计算机视觉技术对书法文字单字图像进行识别, 在古籍研究和文化传播中具有重要应用. 目前书法文字识别技术已经取得了相当不错的进展, 但依旧面临很多挑战, 比如复杂多变的字形可能导致的识别误差, 汉字本身又存在较多形近字, 且汉字字符类别数与其他语言文字相比更多, 书法文字图像普遍存在类内差距大、类间差距小的问题. 为解决这些问题, 提出叠层模型驱动的书法文字识别方法(Stacked-model driven character recognition, SDCR), 通过使用数据预处理、节点分离策略和叠层模型对现有单一分类模型进行改进, 按照字体类别对同一类别不同字体风格的文字进行二次划分; 针对类间差距小的问题, 根据书法文字训练集图像识别置信度对形近字进行子集划分, 针对子集进行嵌套模型增强训练, 在测试阶段利用叠层模型对形近字进行二次识别, 提升形近字的识别准确率. 为了验证该方法的鲁棒性, 在自主生成的SCUT_Calligraphy数据集和CASIA-HWDB 1.1, CASIA-AHCDB公开数据集上进行训练和测试, 实验结果表明该方法在上述数据集的识别准确率均有较大幅度提升, 在CASIA-HWDB 1.1、CASIA-AHCDB和自建数据集SCUT_Calligraphy上测试准确率分别达到96.33%、99.51%和99.90%, 证明了该方法的有效性. |
关键词 | 书法文字识别 模型驱动 节点分离 叠层模型 精度学习 |
DOI | 10.16383/j.aas.c230460 |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/56709 |
专题 | 学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 麻斯亮,许勇. 叠层模型驱动的书法文字识别方法研究[J]. 自动化学报,2024,50(5):947-957. |
APA | 麻斯亮,&许勇.(2024).叠层模型驱动的书法文字识别方法研究.自动化学报,50(5),947-957. |
MLA | 麻斯亮,et al."叠层模型驱动的书法文字识别方法研究".自动化学报 50.5(2024):947-957. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
AAS-CN-2023-0460.pdf(9348KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[麻斯亮]的文章 |
[许勇]的文章 |
百度学术 |
百度学术中相似的文章 |
[麻斯亮]的文章 |
[许勇]的文章 |
必应学术 |
必应学术中相似的文章 |
[麻斯亮]的文章 |
[许勇]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论