- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
复杂样张倾斜检测(‘)
L———————4—~—~—————‘一
刘秋元
300071南开大学机器智能研究所
QLiu@Computer.Org
摘要
样张的倾斜检测和校正是文档识别系统的一个重要组成部分,本文给出了一种对样张
1tt象进行自底向上分析、寻找可用于拟舍直线的文字行、列或直线段的倾斜检测算法,该
算法快速、准确并能够处理横竖混排版面的样张。
人看书认字时纸张钭一点没关系,计算机则不行,它要求图象是正的或至少知道图象
倾斜的角度fl】[2】,否则有些处理如投影就难以进行,以致于本来很好分割的图象变得不可
分,如图I。因此样张的倾斜检测和校正便成为文档识别系统的一个重要组成部分【31。
1.现状
有不少关于倾斜检测的
研究f4】,它们的缺点是不能
分析复杂版面如古混排版
面、图、表等,如果样张只
古少量这种非正文版面,一
般地可使用基于Hough变换
的方法及其衍生出很多种不
同算法f5】f6】.这类算{击有两
个缺陷:
1)参数太多,
21需多遍扫描。
1L
Smith提出了一种寻找正文行的算法,并
对该算_j去与基于Hough变换的算法作了比较,
得出结论该类算法速度快、准确度也高【4】。
2.本项目方法
我们认为只有把样张中版块的二维关系表示出来才能处理复杂的横竖混排的样张,如
图2列出了几种情况,找们称之为把版块按二维排序。算法基本思想是寻找能用于作直
n本项目受天津市2l世纪青年科学基金资助.
一125—
线拟合的目标:文字行/列或直线,扫描过程中判断目标是否得到,算法采用自底向上分析
这样能充分利用图象中的细节信息。
处理过程为: 图2 新块是否与已有块重叠
n对图象从左上角开始逐 示例 X轴 Y轴 处 理
行扫描,分析相连成分, (a) Y船 Y船 台并
我们称Blob。 (b) Y∞ No 转61作探测纵向
2、对生成的Blob按=维 No Y鹪 插入本行,转11
(c)
整序。这是本算法的关 (d) No NO 插入下一行
键。 表l新块与已有块的关系及相应处理。
方法:确定新生成块在当
前行中X轴上的位置并检查其与相邻块Y轴上是否重叠,这两个方向上有4种
情况,如表l所示。
3)对所得行检查其长度及行内各块是否可用于计算倾斜,若是转5),并确定图象的
该局部为横排,后面不再作纵向探测。若行内各块平均高度足够小且几乎没有空
隙,认为是直线。这里涉及Blob大小的参数全是根据统计信息自适应地求出,
这样确保用于计算倾斜的各Blob足够均匀而确保所求角
度的准确性。
4)若所得行不足以计算倾斜,释放该行,转1)继续扫描。
5)计算倾斜,对得到的象素块的中心用最小均方误差(LMSE)
准则作直线拟合求取倾斜角度。采用选代算法(附后).为
了准确起见,对一页样张我们寻找两个文字行,列,以两次
所得角度的平均值作为样张的倾斜角,但如果检测到直
线,只算一次。
61纵向探测文字列。检查初始的两块,若有构成文字列的潜
力,则在比当前块稍宽的区间(称探测区问,图3两虚线问的范围)内逐行扫描
得到相连块,并仿5)计算累积偏移,校正撵测区同.这样探测直到样张底部·若
探测中横坐标x偏移
文档评论(0)