一种基于直线提取和一的通用表格分析方法.pdfVIP

  • 15
  • 0
  • 约1.1万字
  • 约 6页
  • 2017-08-09 发布于安徽
  • 举报

一种基于直线提取和一的通用表格分析方法.pdf

一种基于直线提取和补全的通用表格分析方法 章海涛 李志峰 (中科院自动化所文字识别工程中心 北京100080) 摘要 表格分析是表格自动处理过程中的第一步.本文充分利用表格的特点,给出一个基 于直线提取和补全的通用表格分析方法.先使用一种矢量化的直线提取算法在游程连通 圉的基础上得到表格线,同时对表格进行倾斜校正.然后根据表格特性调整表格线,再 从表格线得到表格特征点,最后建立规则通过对表格线的补全来求得表格结构的行单元 描述.使用该方法对表格图象进行分析,能处理表格线断裂、文字表格线粘连等常见问 题,正确得到表格结构. 关键词表格分析 表格自动处理 直线提取 1 引言 and 文本分析和识别(Document AnalysisRecognition)是九十年代的热门研究课题, 目前已得到了较为广泛的应用。表格文本(FormDocument)作为一种常见文本,是日常 l:作中处理得最多的文本之一。因此表格分析和识别有着很大的研究和应用价值。 表格自动处理过程可以分成二个步骤。第

文档评论(0)

1亿VIP精品文档

相关文档