基于代码的二代身份证文字识别算法研究.docxVIP

基于代码的二代身份证文字识别算法研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于代码的二代身份证文字识别算法研究 近年来,随着计算机技术、数据处理和模式识别技术的成熟,自动身份验证技术也产生了。市场上有很多类型的身份阅读器,但需要认证身份的单位只有基本的办公设备,如计算机、扫描仪和摄像头。考虑到身份识别的特殊性,本文主要研究了这些有限的办公设备如何识别和记录第二代身份。 1 身份证图像的预处理 第二代身份证表面复杂的防伪图案给身份证扫描造成了强烈的干扰, 而且这些防伪图案叠加到文字信息上会使文字之间存在着较大的明暗度差别, 有些汉字的笔划灰度也有较大的变化, 再加上扫描而成的身份证图像常会发生旋转, 这些都给有效识别二代身份证的图文信息带来很大的困难.因此, 在对二代身份证的图文信息进行提取之前, 需对身份证图像进行预处理, 包括:图像的旋转矫正、二值化、身份证区域的提取与缩放等操作. 1.1 图像东南角旋转 身份证图像的旋转矫正过程关键是要能准确地确定图像的旋转角度.角度确定后, 按该角度将身份证图像的数据矩阵绕图像的中心点旋转.如果角度是正数, 就将图像逆时针旋转;如果是负数, 则将身份证图像顺时针旋转.旋转后的图像超出的部分填充像素0 (黑色) .可以采用Canny边缘检测算子 1.2 图像的二值化操作 识别系统在导入彩色的二代身份证图像后, 将图像灰度化, 然后创建一个指定半径为9的平面圆盘形的结构元素, 对灰度图像进行形态开操作, 从而提取身份证图像中的背景图像.根据身份证背景图像灰度的分布特性, 将最佳分割阈值设为T= (fmax1- (fmax1-fmin1) /4) /255, 其中, fmax1、fmin1分别为背景图像中的最大和最小灰度值.这种算法简单, 时间复杂度低, 能将身份证图像中的字符和人脸图像信息较好地从图像中分离出来.二值化结果如图2所示. 1.3 身份证区域图像的提取 经过旋转矫正、二值化操作后, 图像中身份证区域的周边会有一些干扰条纹, 给系统对图文信息的有效识别造成些困难.因此, 为了能够快速、准确地定位到识别系统需要读取的信息, 需要提取出身份证图像中的身份证区域.系统采用基于滑动窗口搜索的算法来提取身份证区域. 具体算法步骤如下: 1) 图像反转. 一般而言, 在一幅二值图像中像素值为1的点称为前景, 像素值为0的点称为背景.身份证背景图像二值化后, 图像中白色占据着主导地位, 而系统要识别的信息是黑色区域.为了信息定位的方便, 系统首先应用公式 倒转图像的强度, 产生图像反转的对等图像, 让系统要识别的信息为前景. 2) 初始化一个矩形窗口, 设定该窗口的右下角坐标与背景图像的右下角坐标相同, 左上角坐标为背景图像中心点的坐标. 3) 分别计算该矩形窗口中的背景图像最后一行与最后一列的像素和, 如果其中有一项不为0, 就往左上角方向移动窗口, 直至窗口中的背景图像最后一行与最后一列的像素和都为0.此时, 窗口右下角坐标就是身份证图像的右下角坐标. 4) 分别计算3) 步中移动后的提取窗口中的背景图像第一行和第一列的像素和. 5) 如果窗口中的图像第一列的像素和不为0, 则向左扩大窗口, 直至窗口中的图像第一列的像素和为0. 6) 如果窗口中图像第一行的像素和不为0, 则向上扩大窗口, 直至窗口中的图像第一行的像素和为0.此时窗口左上角坐标就是最终身份证区域的左上角坐标, 此时的窗口就是最终提取窗口. 7) 将窗口内身份证区域的背景图像提取出来. 提取出来的身份证区域二值图像及其对应的灰度图像如图3所示. 1.4 图像尺寸过抗性分析 文中研究的识别系统不限制导入的身份证图像的大小, 不论图像分辨率多大都可以识别出来.但是, 如果导入的图像尺寸过大会影响识别的效率, 因此, 利用数字图像的最近邻插值算法 1) 判断图像的高度和宽度是否都小于800; 2) 如果其中有一项大于等于800, 则通过Matlab的imresize函数, 采用最近邻插值算法将图像缩小为原来的一半; 3) 重复第 (1) 步, 直至图像的高度和宽度都小于800, 则算法结束. 2 识别和识别人类 识别系统先从身份证图像中提取出人脸图像, 然后通过摄像头对身份证持有者的人脸进行拍照, 将照片与身份证中的人脸图像进行检测识别. 2.1 身份证图像中人脸图像区域的提取 系统对身份证二值背景图像进行了Canny边缘检测, 并采用八邻域直接扫描标记算法对图像连通域进行标记, 接着采用regionprops函数来测量身份证图像中每个标注区域的开始行、开始列、宽度及高度等.图像中人脸图像区域有个共同的特点, 就是其宽度值小于高度值, 且高度值与宽度值都小于50.对照图像中标注区域的基本属性, 提取出符合人脸图像特点的区域.提取出来加以保存之后, 将身份证二值背景图像中的人脸图像区域用像素1值来填充,

文档评论(0)

hzyacc + 关注
实名认证
文档贡献者

专业的文档设计与制作

1亿VIP精品文档

相关文档