一种身份证字符分割方法.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种身份证字符分割方法 1 身份证照片的预处理 识别领养信息主要有两种方法。识别输入国内识别芯片数据和身份图像的光学文本符号。本文在采用图像自动识别的方法进行身份证信息采集的过程中,针对便携式应用进行了算法优化。便携式身份证信息采集系统可以广泛地用于公共安全、电信、银行、以及交通系统等领域。 身份证信息识别主要是对光学字符识别,身份证信息分别是身份证号码、姓名、性别、民族、家庭住址。准确的识别汉字,需要对信息进行块切割和字符切割。但是由于在拍照过程中,随机性比较大,照片质量不能保证,会产生如身份证倾斜、照片偏暗或偏亮、对比度小、照片大小不定等问题,这给身份证图像的分割处理带来了困难。 目前,常见的身份证切割方法是根据身份证固定长度对身份证图像进行标定切割或者是根据质量较好的照片进行大致选取模糊位置切割 2 斜率 传统图像矫正步骤是先对图像进行水平矫正 2.1 radon变换 设f(x,y)为一个二维函数,则Radon变换定义如下: 其中, 运用Radon变换公式2分别对图像进行不同角度的旋转变换,旋转方法如图1所示,再运用公式1对旋转后的图像沿水平线求一阶导数累加和得到一维数组 2.2 图像背景角度的求法 (1)对图片进行二值化和边缘化处理,减去图像干扰(测试选择的图片都是实验结果中的偏暗左倾斜图片)。 (2)旋转图像任意θ角度(旋转角度θ在-20°~20°之间),求得图像对应的水平投影。每个θ对应一个数组,若θ表示一个二维数组中的一列,θ对应的一维数组和θ就可以组成一个二维数组A。求数组A中元素的最大值,并求出对应的θ值,θ为水平旋转角度。图2中亮度最高对应的点是选出数组A最大元素所在的点,对应的θ即是倾斜角度。 (3)按照θ对图片旋转,得到的图像即是水平倾斜纠正的图像,如图3所示。 3 连通域的选择 (1)为了去除图像在获取时的噪声,对图像进行中值滤波 (2)根据身份证上面有较多的蓝色条纹和红色条纹的特征,提出了三阈值过滤的方法。首先遍历图片每个像素点,分别得到R、G、B三色的平均值,再求出RGB阈值 (3)对滤色后的图像进行边缘检测,再通过连通域处理,得到所有的外连通域,求出连通域面积的平均值,进而动态地设定选择连通域的阈值。根据头像连通域的面积比字体连通域面积大很多的特点,标记出连通域面积大于连通域阈值的位置,利用标记出单个标记的连通域或者三个连通域组成的三角形定位头像位置后,设置身份证图像左半部分包括整个头像信息最亮,去除整个头像和边界干扰信息,如图4所示,最后对去除头像的图像进行二值化处理。为了让图像的像素点便于我们遍历,把图4进行颜色反转,如图5所示。 4 字段和归一化 4.1 生成的网格化后的行切割检测算法 从上到下逐行扫描二值图像,计算每一行的象素值为0的像素个数,取得水平投影。利用行间隔造成的水平投影低谷,将文字行分割 对图像进行水平投影后,可得到满足条件的纵向像素点个数和,得到一维数组B。B数组中满足: 则i点是分割点。 其中x 若数组中满足, 其中x 预处理后的图像不可能是完全理想的图像,如图5中非字符行的位置出现干扰,所以在行切割过程中,必须加入行切割检测算法,去掉干扰行。检测算法步骤:求得行间距平均值的Row平均,每行的宽度必须在Row平均*60%和Row平均*150%之间,否则删除其对应的上、下切割点。 4.2 字符切割检查 对上述分割出来的行图像如图6所示,进行垂直投影得到一维数组C,图像的横坐标是数组长度,横坐标对应的每列像素和是C数组相应位置的元素数值。 若C数组中满足公式3,则i点是前分割点;若数组中满足公式4,对应的i+3是后分割点。根据前、后分割点,即可切割出一个字符。 与传统的切割方法相比,为了避免有空隙的汉字切割出多个字符和避免图像预处理后产生的干扰信息切割成一个字符,例如“州”字可能被数值投影成3或4个部分,一个黑点切割成一个字符等,本切割方法增加了字符切割检查算法。 首先求出每行中切割字符平均值Ch 字符分割后,字符大小不相同。为了后期字符识别方便,需将字符归一化为25×50像素大小的图像。 归一化算法应用图像的双线性插值放大算法 切割并归一化的效果如表2中的分割效果图。 程序为了测试实验切割算法的正确性,选用200万以上像素的摄像头采集的身份证图像作为测试样图,为了测试切割算法的正确率和鲁棒性,取50张明亮不同,倾斜度不同的照片进行测试。 在表2中,选取了三个最典型的示例,第一示例亮度低,左倾斜,照片边缘有暗影,在预处理后,图像的干扰还是没有完全去除,如图5,利用后期的检验机制,可以去掉干扰行,但是如表2中第一种类型,由于图片亮度太低,在RGB全局阈值分割下出现了粘连,分割不出两个字符,正确率97.8%。第二示例的图片是所有测试图片中质量最高的,图片的亮度适中,无倾斜度,能

文档评论(0)

xcwwwwws + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档