基于深度学习的身份证信息提取.docxVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度学习的身份证信息提取 1 算机视觉技术 图像是智能机器获取信息的重要来源之一。随着计算机视觉技术的发展,计算机视觉技术在行业中取得了许多成功的应用,如零件故障检测、自动驾驶汽车等。OCR字符识别技术也取得了重大的进展。身份证识别技术为OCR识别技术之一, 目前身份证识别主要有基于匹配分类和基于机器学习的方法 2 图像采集器件与图像微距拍摄时功能差异测试 本文主要针对的是拍摄设备近距离采集的身份证图像, 要求身份证图像上号码信息较为清晰, 人眼基本可辨别, 且图像上身份证区域占据主要部分, 无复杂背景干扰, 当前图像采集器材分辨率、微距拍摄等功能已能满足要求, 故在实际应用中是可行的。 图1为基于计算机视觉的身份证识别算法框图, 文中首先提取原始图像的R分量作为分析对象, 针对拍摄亮度不足时, 补光灯造成的图像亮度不均或存在高光等问题, 采用自适应阈值图像分割算法去除身份证非字符区域, 然后使用形态学操作使字符粘连的方法提取字符轮廓, 根据轮廓面积及长宽比例提取身份证号码区域, 最后切分身份证字符并使用已训练的lenet-5深度学习网络模型进行识别。 2.1 认证区域中的身份号 2.1.1 图像显示区域的选择 身份证样张上字体为黑色, 背景则为纯颜色, 为使字体与背景具有更大的区分度, 取身份证图的R通道作为图像的灰度化处理, 为便于后期定位身份证号码区域时字符之间相互粘合, 结合身份证图片长宽比例, 依次在3种分辨率下尝试定位身份证号码区域, 这3种缩放分辨率分别为: 2.1.2 图像光照均匀 本文针对的是近距离拍摄的身份证图像, 身份证整体轮廓占主要部分, 由于身份证样张上字符颜色与背景颜色通常存在明显的差别, 当采集的身份证图像光照均匀时, 采用Otsu全局阈值二值化图像, 二值化效果好;但由于光线不足, 拍摄设备开启补光灯等原因造成高光区域时, Otsu全局阈值二值化效果不佳, 这是由于Otsu算法没有考虑局部灰度信息的干扰 对Otsu二值化方法作出改进。 将图像切分为N×N块, 对每一分块使用Otsu二值化算法计算得阈值 图2为身份证图像二值化处理的效果图, 可看出对于光照均匀或存在高光的图像, 算法都能得到清晰的二值化号码。 2.1.3 结构元素法提取身份证号码区域 图3为形态学操作及号码区域定位的效果图, 由于形态学的粘连效果受到结构元素大小的影响, 故本文固定闭运算结构元素大小, 并尝试在三种分辨率下提取身份证号码区域, 以正确切分号码的位数作为是否定位成功的标志。 2.2 ofig反色算法 先从R分量上依据定位得的身份证号码区域将其分割出, 对分割得的图像作如下操作: (1) 使用Otsu二值化算法分割图像并进行反色, 即字体为白色, 背景为黑色。 (2) 先使用水平投影法确定字符的高度, 由于少部分字符之间可能存在粘连, 故对垂直投影法做出改进, 记身份证号码区域图像的宽度为W, 当满足公式 (1) 时, 对[h 2.3 卷积神经网络模型 lenet-5是Yann Le Cun教授针对手写数字图像所开发的卷积神经网络模型 其中, 卷积层C1、C3所用卷积核大小均为5×5大小, 采样层S2、C3通常为均值采样, 感受域大小为2×2, 其余则为全连接结构。 3 训练样本编码 本文实验配置为Ubuntu14.04, GTX750Ti的机器, 从网上及实际拍摄获得身份证图像共576张, 分为两部分, 其中的300张用于训练, 276张用于测试。使用本文算法对训练样本做字符分割, 可正确切分字符的样本为287, 定位及切分准确率为95.66; 本文使用开源的caffe版本lenet-5进行实验。由于从训练样本获得的字符仅为4895张0~9二值图像, 故通过添加噪声、小角度倾斜、不同阈值二值化等方法将字符集扩充为8W, 通过10W次迭代, 训练准确率为96%左右, 在字符识别时, 容易错分的是字符“3”和“8”、“0”和“9”。276张用于测试的图像可识别得251张, 整体识别率为91%左右, 具有较高的应用价值。 4 基于lenet-5的校验位学习 本文提出了一种基于计算机视觉技术的身份证识别算法, 算法对光照均匀图像和存在高光的图像均能有效地定位身份证号码, 对垂直投影法作出改进以更适合分割粘连的字符, 最后对于除校验位外的字符图像, 使用lenet-5深度学习模型进行训练及分类, 校验位可由前17位数字计算得到。 对二值化图像作反色操作, 并使用核大小为[15, 3]的矩形结构元素对其做形态学闭运算, 使号码字符发生粘连为一块区域, 然后使用Opencv库自带轮廓检测方法检测各区域轮廓, 并依据身份证号码轮廓面积及长宽比例筛选各区域, 将筛选剩余的区域中最长的区域作为身份证号码区域, 文中将长宽比例

文档评论(0)

ss_account + 关注
实名认证
文档贡献者

专注于文档制作,提供高质量文档

1亿VIP精品文档

相关文档