基于caffe的身份证图像分割.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于caffe的身份证图像分割 1 非接触式场景的身份证录入 随着时间的推移,银行、酒店和其他地方都需要公民身份信息。以前通过手写方式录入身份证信息会花费大量的人力物力而且效率低下。随着二代身份证中植入芯片, 利用读卡的方式代替了人工, 极大地提高了信息录入的效率, 但是网络时代的快速发展, 人们的大部分活动都可以在网络上进行, 为了信息安全, 各大网络平台都提出了实名认证的要求, 此类非接触式的场景的信息录入不能通过读卡的方式解决, 但是随着图像处理技术和OCR技术的发展和成熟, 可以通过图像处理提取身份证图片上的文字, 使用OCR技术识别为文本, 这种方法录入身份证信息十分方便快捷。 本文重点在于研究如何正确分割身份证文字, 以往对于身份证分割算法主要有两种, 一是投影法 2 图像预处理 2.1 abcd倾斜的平稳性 对于倾斜的图像需要进行倾斜矫正。矫正的核心在于寻找倾斜角。首先对身份证图像进行中值滤波 如图1所示, ABCD代表身份证图像, 扫描线向右扫描, 假设扫描线与AD得到N个交点, 与AB得到M个交点, 则可制定如下定义。 取U 计算AB, AD的斜率, 记为K 最终旋转角度判定: 矫正后得到结果如图2、3。 图2和图3分别是左右倾斜通过该算法处理后的矫正情况, 通过结果可以看出矫正效果还是比较不错的。 2.2 暗通道图像的a值 对于模糊图像需要进行增强处理, 以往图像增强大多使用直方图均衡化 其中Ω (x) 是以像素x为中心的一个窗口, c表示彩色图像的RGB通道。 根据雾图的形成模型: 其中I (x) 是待处理的图像, J (x) 是处理后的图像, A是全球大气光成分, t (x) 是透射率。 由暗通道的先验理论可知J 当透射率t的值很小时, 会导致J的值偏大, 使得图像整体偏白, 可设置阈值t 以上式子的计算需要已知A值, A值通过以下两步求得 (1) 从暗通道图中按照亮度的大小取前0.1%的像素。 (2) 在这些位置中, A值即为原始图像I中最高亮度的点所对应的值。 经过算法处理后, 得到结果如图4~7。 图4和图5分别为计算后得到的暗通道图和透射率图, 结合图6和图7, 可以看出图像对比度有了明显的增强。 2.3 根据分割线确定镜头的分割方法,将所有块 为了得到更好的二值化效果, 本文通过对身份证图像进行分块来去除身份证图像上的干扰部分。根据身份证图像排版可将图像划分为横向五小块, 则可制定如下分割方法: (1) 分别求出各个块之间的间距, 选出最大的间距, 最大间距的下边界作为身份证号码部分的上边界, 记为IN (2) 求得身份证号码第一个数字的左边界和最后一个数字的右边界, 取其距离的一半作为分割出头像的左边界, 记为HI (3) 根据IN 分割示意图如图8, 先根据分割线1将图分为上下两部分, 再根据分割线2, 将上部分为两块, 则可去除头像部分。 3 图像字符的分割 3.1 基于caffe框架的训练识别模型 在地址部分需要通过预识别来剔除数字干扰, 需要训练数字识别模型, 本文利用Caffe框架来训练识别模型, 具体步骤如下: (1) 准备图片样本, 分为训练集和测试集。 (5) 通过训练出的模型和网络识别图片。 3.2 进行动态阈值二值化 经过图像的分块处理后, 去除了头像块, 对于剩下的两块需要进行字符行分割。对于身份证号码块, 通过对块的动态阈值二值化 (1) 对分出的块做滤波处理 (2) 进行动态阈值二值化。 (3) 通过水平投影法确定上下边界坐标。 (4) 判断是否是地址部分, 如果不是则根据 (3) 中得到的坐标分割图像, 反之进入 (5) 。 (5) 通过先验知识设定行高范围, 判断地址部分第一行文字是否正确分割, 之后得到的每行的高度与第一行进行比较, 如果下面相邻俩行的高度均小于μ (通过实验设置, 本文取50) , 合并这两行后分割, 反之, 直接根据 (3) 中得到的坐标分割。 经过行分割后得到如图9结果。 3.3 分布位置的分割法 行分割后需要对每一行字符进行列分割得到单个字符。本文先根据原图像和二值化后的图像来分别得到位置信息, 结合两部分位置信息来确定最终的分割位置用来去除蓝色字体部分, 然后再根据垂直投影分割出单字符, 具体步骤如下: (1) 通过设定RGB的值在原图像上寻找蓝色像素的分布位置, 取其右边界。 (2) 在二值化图像上从右向左通过投影法找到姓名栏中最大间距, 取其右边界。 (3) 取 (1) , (2) 中的两个右边界距离的中点作为分割部位去除蓝色字体。 (4) 对于分割出的字体部分进行动态阈值二值化。 (5) 根据垂直投影法确定左右边界后分割图像。 3.4 caffe框架下的预识别 由于汉字的结构问题, 例如左右结

文档评论(0)

182****8318 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档