基于深度学习的身份证信息提取.docxVIP

下载本文档

2
0
约2.02千字
约 3页
2023-07-30 发布于广东
举报
版权申诉

基于深度学习的身份证信息提取.docx

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于深度学习的身份证信息提取 1 算机视觉技术图像是智能机器获取信息的重要来源之一。随着计算机视觉技术的发展，计算机视觉技术在行业中取得了许多成功的应用，如零件故障检测、自动驾驶汽车等。OCR字符识别技术也取得了重大的进展。身份证识别技术为OCR识别技术之一, 目前身份证识别主要有基于匹配分类和基于机器学习的方法 2 图像采集器件与图像微距拍摄时功能差异测试本文主要针对的是拍摄设备近距离采集的身份证图像, 要求身份证图像上号码信息较为清晰, 人眼基本可辨别, 且图像上身份证区域占据主要部分, 无复杂背景干扰, 当前图像采集器材分辨率、微距拍摄等功能已能满足要求, 故在实际应用中是可行的。图1为基于计算机视觉的身份证识别算法框图, 文中首先提取原始图像的R分量作为分析对象, 针对拍摄亮度不足时, 补光灯造成的图像亮度不均或存在高光等问题, 采用自适应阈值图像分割算法去除身份证非字符区域, 然后使用形态学操作使字符粘连的方法提取字符轮廓, 根据轮廓面积及长宽比例提取身份证号码区域, 最后切分身份证字符并使用已训练的lenet-5深度学习网络模型进行识别。 2.1 认证区域中的身份号 2.1.1 图像显示区域的选择身份证样张上字体为黑色, 背景则为纯颜色, 为使字体与背景具有更大的区分度, 取身份证图的R通道作为图像的灰度化处理, 为便于后期定位身份证号码区域时字符之间相互粘合, 结合身份证图片长宽比例, 依次在3种分辨率下尝试定位身份证号码区域, 这3种缩放分辨率分别为: 2.1.2 图像光照均匀本文针对的是近距离拍摄的身份证图像, 身份证整体轮廓占主要部分, 由于身份证样张上字符颜色与背景颜色通常存在明显的差别, 当采集的身份证图像光照均匀时, 采用Otsu全局阈值二值化图像, 二值化效果好;但由于光线不足, 拍摄设备开启补光灯等原因造成高光区域时, Otsu全局阈值二值化效果不佳, 这是由于Otsu算法没有考虑局部灰度信息的干扰对Otsu二值化方法作出改进。将图像切分为N×N块, 对每一分块使用Otsu二值化算法计算得阈值图2为身份证图像二值化处理的效果图, 可看出对于光照均匀或存在高光的图像, 算法都能得到清晰的二值化号码。 2.1.3 结构元素法提取身份证号码区域图3为形态学操作及号码区域定位的效果图, 由于形态学的粘连效果受到结构元素大小的影响, 故本文固定闭运算结构元素大小, 并尝试在三种分辨率下提取身份证号码区域, 以正确切分号码的位数作为是否定位成功的标志。 2.2 ofig反色算法先从R分量上依据定位得的身份证号码区域将其分割出, 对分割得的图像作如下操作: (1) 使用Otsu二值化算法分割图像并进行反色, 即字体为白色, 背景为黑色。 (2) 先使用水平投影法确定字符的高度, 由于少部分字符之间可能存在粘连, 故对垂直投影法做出改进, 记身份证号码区域图像的宽度为W, 当满足公式 (1) 时, 对[h 2.3 卷积神经网络模型 lenet-5是Yann Le Cun教授针对手写数字图像所开发的卷积神经网络模型其中, 卷积层C1、C3所用卷积核大小均为5×5大小, 采样层S2、C3通常为均值采样, 感受域大小为2×2, 其余则为全连接结构。 3 训练样本编码本文实验配置为Ubuntu14.04, GTX750Ti的机器, 从网上及实际拍摄获得身份证图像共576张, 分为两部分, 其中的300张用于训练, 276张用于测试。使用本文算法对训练样本做字符分割, 可正确切分字符的样本为287, 定位及切分准确率为95.66; 本文使用开源的caffe版本lenet-5进行实验。由于从训练样本获得的字符仅为4895张0~9二值图像, 故通过添加噪声、小角度倾斜、不同阈值二值化等方法将字符集扩充为8W, 通过10W次迭代, 训练准确率为96%左右, 在字符识别时, 容易错分的是字符“3”和“8”、“0”和“9”。276张用于测试的图像可识别得251张, 整体识别率为91%左右, 具有较高的应用价值。 4 基于lenet-5的校验位学习本文提出了一种基于计算机视觉技术的身份证识别算法, 算法对光照均匀图像和存在高光的图像均能有效地定位身份证号码, 对垂直投影法作出改进以更适合分割粘连的字符, 最后对于除校验位外的字符图像, 使用lenet-5深度学习模型进行训练及分类, 校验位可由前17位数字计算得到。对二值化图像作反色操作, 并使用核大小为[15, 3]的矩形结构元素对其做形态学闭运算, 使号码字符发生粘连为一块区域, 然后使用Opencv库自带轮廓检测方法检测各区域轮廓, 并依据身份证号码轮廓面积及长宽比例筛选各区域, 将筛选剩余的区域中最长的区域作为身份证号码区域, 文中将长宽比例