一种图文混排图象的纠斜算法.pdfVIP

  • 8
  • 0
  • 约 6页
  • 2017-08-09 发布于安徽
  • 举报
一种图文混排图象的纠斜算法 田学东郭宝兰 河北大学计算机科学学院保定071002 摘 要印刷文档图象的歪斜会严重影响汉字识别系统的识别率.本文在对已有的 纠斜方法进行比较的基础上,提出了一种以每个汉字底部中点作为采样点,利用Hough 变换检取文字行基线得到倾斜角的方法.实验结果表明,这种方法有效地克服了一般 Hough变换测斜方法采样点多、计算量走,以及易受非文本成分干扰的缺点,具有较好 的适应性、准确性和较高的速度. 关键词纠斜,Hough变换,汉字识别.倾斜角 1 引 言 图象歪斜会使版面和文字的特征发生变异,从而对版面分析、字符识别等汉字识别 系统(汉字OCR)的一系列环节造成不良影响。因此,目前大多数汉字识别系统都具 有自动纠斜和手动纠斜功能,但其自动纠斜功能受图象成分影响很大.效果不稳定。 手动纠斜要由用户使用鼠标在图象上画一条能够反映倾斜程度的直线以告知系统校正 角度、得到校正图象。由于需要人工干预.准确性、速度均难于保证,影响了识别系 统的自动化程度。因此.研究适应性强、速度快、准确性高的自动纠斜方法.对提高 识别系统的效率是很有意义的。 2现有测斜方法分析 纠斜的难点在于测斜。目前的铡斜方法可归纳为三类。 2.1投影特征法

文档评论(0)

1亿VIP精品文档

相关文档