- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度学习的身份证信息提取
1 算机视觉技术
图像是智能机器获取信息的重要来源之一。随着计算机视觉技术的发展,计算机视觉技术在行业中取得了许多成功的应用,如零件故障检测、自动驾驶汽车等。OCR字符识别技术也取得了重大的进展。身份证识别技术为OCR识别技术之一, 目前身份证识别主要有基于匹配分类和基于机器学习的方法
2 图像采集器件与图像微距拍摄时功能差异测试
本文主要针对的是拍摄设备近距离采集的身份证图像, 要求身份证图像上号码信息较为清晰, 人眼基本可辨别, 且图像上身份证区域占据主要部分, 无复杂背景干扰, 当前图像采集器材分辨率、微距拍摄等功能已能满足要求, 故在实际应用中是可行的。
图1为基于计算机视觉的身份证识别算法框图, 文中首先提取原始图像的R分量作为分析对象, 针对拍摄亮度不足时, 补光灯造成的图像亮度不均或存在高光等问题, 采用自适应阈值图像分割算法去除身份证非字符区域, 然后使用形态学操作使字符粘连的方法提取字符轮廓, 根据轮廓面积及长宽比例提取身份证号码区域, 最后切分身份证字符并使用已训练的lenet-5深度学习网络模型进行识别。
2.1 认证区域中的身份号
2.1.1 图像显示区域的选择
身份证样张上字体为黑色, 背景则为纯颜色, 为使字体与背景具有更大的区分度, 取身份证图的R通道作为图像的灰度化处理, 为便于后期定位身份证号码区域时字符之间相互粘合, 结合身份证图片长宽比例, 依次在3种分辨率下尝试定位身份证号码区域, 这3种缩放分辨率分别为:
2.1.2 图像光照均匀
本文针对的是近距离拍摄的身份证图像, 身份证整体轮廓占主要部分, 由于身份证样张上字符颜色与背景颜色通常存在明显的差别, 当采集的身份证图像光照均匀时, 采用Otsu全局阈值二值化图像, 二值化效果好;但由于光线不足, 拍摄设备开启补光灯等原因造成高光区域时, Otsu全局阈值二值化效果不佳, 这是由于Otsu算法没有考虑局部灰度信息的干扰
对Otsu二值化方法作出改进。
将图像切分为N×N块, 对每一分块使用Otsu二值化算法计算得阈值
图2为身份证图像二值化处理的效果图, 可看出对于光照均匀或存在高光的图像, 算法都能得到清晰的二值化号码。
2.1.3 结构元素法提取身份证号码区域
图3为形态学操作及号码区域定位的效果图, 由于形态学的粘连效果受到结构元素大小的影响, 故本文固定闭运算结构元素大小, 并尝试在三种分辨率下提取身份证号码区域, 以正确切分号码的位数作为是否定位成功的标志。
2.2 ofig反色算法
先从R分量上依据定位得的身份证号码区域将其分割出, 对分割得的图像作如下操作:
(1) 使用Otsu二值化算法分割图像并进行反色, 即字体为白色, 背景为黑色。
(2) 先使用水平投影法确定字符的高度, 由于少部分字符之间可能存在粘连, 故对垂直投影法做出改进, 记身份证号码区域图像的宽度为W,
当满足公式 (1) 时, 对[h
2.3 卷积神经网络模型
lenet-5是Yann Le Cun教授针对手写数字图像所开发的卷积神经网络模型
其中, 卷积层C1、C3所用卷积核大小均为5×5大小, 采样层S2、C3通常为均值采样, 感受域大小为2×2, 其余则为全连接结构。
3 训练样本编码
本文实验配置为Ubuntu14.04, GTX750Ti的机器, 从网上及实际拍摄获得身份证图像共576张, 分为两部分, 其中的300张用于训练, 276张用于测试。使用本文算法对训练样本做字符分割, 可正确切分字符的样本为287, 定位及切分准确率为95.66;
本文使用开源的caffe版本lenet-5进行实验。由于从训练样本获得的字符仅为4895张0~9二值图像, 故通过添加噪声、小角度倾斜、不同阈值二值化等方法将字符集扩充为8W, 通过10W次迭代, 训练准确率为96%左右, 在字符识别时, 容易错分的是字符“3”和“8”、“0”和“9”。276张用于测试的图像可识别得251张, 整体识别率为91%左右, 具有较高的应用价值。
4 基于lenet-5的校验位学习
本文提出了一种基于计算机视觉技术的身份证识别算法, 算法对光照均匀图像和存在高光的图像均能有效地定位身份证号码, 对垂直投影法作出改进以更适合分割粘连的字符, 最后对于除校验位外的字符图像, 使用lenet-5深度学习模型进行训练及分类, 校验位可由前17位数字计算得到。
对二值化图像作反色操作, 并使用核大小为[15, 3]的矩形结构元素对其做形态学闭运算, 使号码字符发生粘连为一块区域, 然后使用Opencv库自带轮廓检测方法检测各区域轮廓, 并依据身份证号码轮廓面积及长宽比例筛选各区域, 将筛选剩余的区域中最长的区域作为身份证号码区域, 文中将长宽比例
您可能关注的文档
- 城市中心超大超深异形基坑工程安全优质建造技术研究.docx
- 错层位外错式相邻巷道联合支护技术研究.docx
- 大型机场航站楼大屋顶装饰工程数字化建造技术.docx
- 大学生就业合同陷阱的预防与识别.docx
- 单承载面连续梁拱组合体系桥总体设计与施工.docx
- 当代后盖梯尔知识论的发展.docx
- 当前县域经济金融发展中存在的问题及对策.docx
- 堤基渗透破坏的数值模拟研究.docx
- 电工钢边缘降控制研究.docx
- 电子商务与信用机制.docx
- 艾瑞咨询-2025年中国舒适眼镜白皮书.pptx
- 专题01 Units 4-6 重点语法归纳 七年级英语上学期期末考点(仁爱科普版2024).pptx
- 安全生产事故隐患大排查“百日攻坚”行动方案.PDF
- 第8课 欧洲的思想解放运动 课件高一下学期统编版(2019)必修中外历史纲要下(3).pptx
- 机械制图相关知识C语言及投影法等内容测试试卷.docx
- 第8课 欧洲的思想解放运动高一下学期统编版(2019)必修中外历史纲要下.pptx
- 第8课 现代社会的移民和多元文化 课件-高二历史统编版(2019)选择性必修三.pptx
- AIGC赋能高职“汽车新媒体营销”课程的应用探索.pdf
- 第8课 中国古代的法治与教化 课件-高三历史统编版(2019)选择性必修1一轮复习.pptx
- 21(null)大型购物中心 室内空气质量 解决方案.pdf
文档评论(0)