- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进的细化算法在印刷文字检测中的技术研究
摘要:针对印刷文字缺陷检测难等问题,本文提出了一种改进的图像细化算法用于文字检测。首先根据投影法分割字符,进一步对分割的字符图像逐步细化得到文字的骨架,然后根据文字骨架的信息完成检测。
关键词:文字分割;图像细化;连通域;文字缺陷
中图分类号:TP391.43 文献标识码:A文章编号:1007-9599 (2011) 17-0000-01
The Technology Research of Improved Thinning Algorithm in the Printed Text Detection
Yang Ximing1,Wu Shuanhu2
(Computer Science,Yantai University,Yantai264005,China)
Abstract:Printed text difficult issues such as defect detection,this paper presents an improved image thinning algorithm for text detection.First,according to projection split character,character images further split to get the text of the skeleton gradually refined,and then complete the information according to the text frame detection.
Keywords:Text segmentation;Image thinning;Connected domain;Text defect
一、引言
印刷质量是印刷品各项外观特性的综合效果,印刷质量的好坏直接影响到印刷产品信息传播的结果,印刷质量控制在印刷过程中占有很重要的地位。在印刷品质量检测中,文字印刷质量和图像印刷质量的行业分类标准不同。通常文字缺陷是指文字区中出现文字破损、断裂和白点等形态缺陷;本文主要针对的文字缺陷信息包括:断线、针孔、凸起、杂点。本文的文字检测方法是用改进的细化算法对二值化之后的图像进行细化,先通过连通域进行初步检测,然后根据细化后的图像特征进行进一步的检测。
二、改进后的细化算法的文字缺陷检测
(一)投影法文字分割。投影法是对二值化后的图像进行扫描,先统计行跳变点的数据得到水平投影图,然后通过突出图像列的边缘特征得到垂直投影图,从而提取所需要的单字符图像。
(二)图像细化。图像的细化是指在保持原图像拓扑结构的情况下,尽可能快地抽出一个单像素宽的骨架的过程。图像细化的方法有两种,即边缘点删除和内点保留,传统的基于边缘点删除的细化算法在细化过程中,只对边缘点的可删除性进行判断并作相应处理,由于受跟踪顺序及所考察邻域的影响容易产生骨架的非对称性,基于内点保留的细化算法容易使所获得的骨架大于一个像素,本文在分析上述两类细化算法的基础上提出一种基于形态学处理的改进细化算法。
为了方便下面细化过程的描述,我们首先对要使用到的几个定义进行阐述,定义如下:
定义1:单像素宽度。考查纹线上每一点的8邻域,,纹线端点的8邻域中只有1个目标点,纹线连续点的8邻域有2个,分叉点有3个,且每点8邻域最多只有3个目标点。符合上述条件即为单像素宽。
定义2:端点和分叉点。对于一个目标点,其8邻域内像素只有一个值为1,其余都是0,则称该目标点为端点;若对一个目标点其8邻域内像素有三个值为1,其余都为0,则称该目标点为分叉点。
根据不同的需要,图像细化的算法和判断条件有很多,但最基本的有两条准则,首先图像细化不能缩短图像骨架的长度,其次,细化不能将图像分解成不同的部分,基于以上两个准则。但是基于以上的算法得到的细化图像并没有达到单像素的宽度,还有极少一部分的像素宽度大于一个像素,因此我们在此基础上定义了4个模板,如图1所示,
图1:单像素处理模板
用这4个模板扫描细化的图像如满足下列条件:
条件1:M位置像素值为1,D、E对应的像素值为1。
条件2:满足条件1,当C位置像素值为1时,M对应像素不可删除,当C位置像素值为0时,M对应像素可删除。
(三)细化图像的文字检测。印刷文字缺陷检测应用的特点是印刷品连续大批量的生产,幅面上对应的位置的内容相对固定,在标准样本中对投影法分割的图像进行细化操作,然后将端点和交叉点的位置保存。在印刷过程中一般出现的缺陷信息有断线、凸起、针孔、杂点。
根据每个字符细化后的特性,我们可以将
原创力文档


文档评论(0)