- 8
- 0
- 约 6页
- 2017-08-09 发布于安徽
- 举报
一种图文混排图象的纠斜算法
田学东郭宝兰
河北大学计算机科学学院保定071002
摘 要印刷文档图象的歪斜会严重影响汉字识别系统的识别率.本文在对已有的
纠斜方法进行比较的基础上,提出了一种以每个汉字底部中点作为采样点,利用Hough
变换检取文字行基线得到倾斜角的方法.实验结果表明,这种方法有效地克服了一般
Hough变换测斜方法采样点多、计算量走,以及易受非文本成分干扰的缺点,具有较好
的适应性、准确性和较高的速度.
关键词纠斜,Hough变换,汉字识别.倾斜角
1 引 言
图象歪斜会使版面和文字的特征发生变异,从而对版面分析、字符识别等汉字识别
系统(汉字OCR)的一系列环节造成不良影响。因此,目前大多数汉字识别系统都具
有自动纠斜和手动纠斜功能,但其自动纠斜功能受图象成分影响很大.效果不稳定。
手动纠斜要由用户使用鼠标在图象上画一条能够反映倾斜程度的直线以告知系统校正
角度、得到校正图象。由于需要人工干预.准确性、速度均难于保证,影响了识别系
统的自动化程度。因此.研究适应性强、速度快、准确性高的自动纠斜方法.对提高
识别系统的效率是很有意义的。
2现有测斜方法分析
纠斜的难点在于测斜。目前的铡斜方法可归纳为三类。
2.1投影特征法
您可能关注的文档
- 一种快速计算、指导和校核尺寸标注的新方法.pdf
- 一种快速灵活的配电网规划方法.pdf
- 一种扩展的汉语统计二元文法语言模型.pdf
- 一种老年糖尿病新型营养治疗方法.pdf
- 一种冷芯盒灰铁壳体脉纹与裂纹的分析与控制.pdf
- 一种理想的测周法及其在晶体压力%2f频率式模数转换中的应用.pdf
- 一种理性的满意控制器设计方法.pdf
- 一种连续时间非线性系统不确定性模型的混沌控制.pdf
- 一种连续时间混沌系统不确定性模型的自适应控制.pdf
- 一种两步优化的模糊非线性预测控制算法.pdf
- 中国国家标准 GB/T 18487.2-2026电动汽车传导充电系统 第2部分:非车载传导供电设备电磁兼容要求.pdf
- GB/T 18487.2-2026电动汽车传导充电系统 第2部分:非车载传导供电设备电磁兼容要求.pdf
- 中国国家标准 GB/T 47477-2026纳米技术 宽温域纳米颗粒测量 凝结核粒子计数法.pdf
- GB/T 47477-2026纳米技术 宽温域纳米颗粒测量 凝结核粒子计数法.pdf
- 《GB/T 47477-2026纳米技术 宽温域纳米颗粒测量 凝结核粒子计数法》.pdf
- GB/T 18837-2026多联式空调(热泵)机组.pdf
- 《GB/T 18837-2026多联式空调(热泵)机组》.pdf
- 中国国家标准 GB/T 18837-2026多联式空调(热泵)机组.pdf
- 母乳喂养科学指导.pptx
- 饲料添加剂管理条例解读.pptx
原创力文档

文档评论(0)