- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于ocr的印刷体数字识别技术研究
随着orc(op自动残疾)技术的发展,单词识别技术在日常生活中得到了广泛应用。作为OCR技术的一个组成部分, 印刷体数字识别技术在车牌识别、身份证识别、护照识别等领域有着非常广阔的应用前景。
传统的识别系统均为采用扫描仪采集图像, 这种方法的优势主要是扫描图像分辨率高, 缺点是速度较慢, 通常需要十几秒, 不能满足快速识别的要求。随着数字摄像头的普及, 可以采用摄像头作为图像采集设备, 结合数字图像处理技术和OCR技术来进行印刷体数字的快速识别。
1 区域定位流程
采用摄像头来进行图像采集, 图像将主要有以下一些特点: (1) 数字区域难于定位。 (2) 图像质量较差, 数字区域与背景区域较难区分, 突发噪声较多。 (3) 图像分辨率低, 亮度不均, 不符合识别要求。
针对这些特点, 本文采用如下流程来设计整个方法 (图1) 。其中, 数字区域定位是为了正确定位到需要识别的数字区域;彩色滤波和二值化用来从复杂背景中提取出我们感兴趣的二值化结果;插值模块解决分辨率较低的问题;分割和识别模块分别对号码进行分割和识别。
2 图像预处理
2.1 身份证放置状态的判断和定位
数字区域定位是为了得到包含待识别数字的区域, 主要由以下3个步骤得到: (1) 判断图像状态; (2) 倾斜纠正; (3) 区域截取。
判断图像位置主要是判断截取图像的正反状态。以身份证识别为例, 摄像头采集到的图像可能有头像向上和向下两种情况, 需要自动判断身份证放置状态并定位号码区域。采集的身份证图像最明显的特征是头像下方的红色印章, 该印章在正放时处于头像的左下角, 反放时处于头像的右上角, 因此, 可以根据红色印章来判断放置的状态, 进而定位号码区域。印章具有独特的颜色特征, 系统综合运用HSI颜色空间的H分量和S分量, 分别对身份证图像的左下角和右上角区域进行判断, 从而得到印章位置, 并定位号码区域。
根据大量样本确定了两个阈值T
同样, 其它类型的图像也可以根据各自特点的先验知识来进行图像状态的判断。
判断状态后就可以进行倾斜纠正和数字区域的截取, 其中倾斜纠正可以通过Hough变换来进行;而数字区域的截取主要由数字区域的先验知识来确定。
2.2 背景条纹信息过滤
彩色滤波的主要目的是过滤掉图像中的各种复杂背景, 比如车牌中的黄色背景, 身份证中的绿色底纹等。由于分割以及识别模块要在灰度和二值空间内进行, 而考虑到把图像转为灰度图像会损失一部分信息, 不易对图像进行分层, 因此应该在彩色空间内把各种复杂背景条纹信息尽量过滤。本方法采用HSI空间中的信息进行彩色滤波。以身份证为例, 身份证背景多为浅绿色, 背景条纹为深绿色, 而文字为黑色。它的直方图为比较明显的双峰, 即黑色文字和绿色底纹。因此可以采用T
由于图像亮度有可能不均匀, 如果使用全局阈值很难达到理想效果, 因此选用局部自动阈值滤去背景。局部自动阈值选取的优点是对图像亮度不均的情况适应性较好, 缺点是运算速度较慢, 但是由于号码区域图像很小, 速度能够满足实时性的要求。
具体算法如下:将号码部分图像进一步细分为子窗口, 对每一个子窗口使用自动阈值分割。因为子窗口内亮度均匀, 使用简单的直方图阈值法, 即求取直方图双峰中的最小值为基值, 加上偏移值得到阈值。
2.3 单个峰类图像的噪声短、难以操作
二值化的主要目的是为了对图像进行分割和特征提取, 目前比较流行的二值化方法主要有3种
全局二值化方法根据整个图像的灰度分布来确定一个整体阈值T, 根据此阈值对图像进行二值分割。通常采用全局二值化的前提条件是图像的直方图具有双峰或者一个非常突出单峰的特性。它的优点是运算简单、速度快, 缺点是需要对整张图做统一处理, 对于光照条件不均匀, 或者噪声较大的图像会得到伪阈值, 因此效果不佳。
局部二值化方法通常都是把图像分成N×N的小窗口, 在每个小窗口内确定阈值, 并进行局部的二值化。它对于光照不均的图像有比较好的二值化结果, 但是运算速度较慢, 难以满足实时性的要求。现有图像具有以下特点:经过彩色滤波, 图像亮度均匀, 有比较好的单峰特性。而且由于经过插值放大, 图像大小为760×100, 局部二值化无法满足快速运算的要求。因此采用全局二值化方法。
全局二值化在图像的二维空间内表示为
由于现有图像亮度均匀, 直方图有比较好的单峰特性, 因此采用Ostu
组内方差
组间方差
对于一幅给定的图像可以证明其组内方差与组间方差的和为常数
2.4 识别难度大且效果不佳
由于整幅图像分辨率较低, 每个数字的有效分辨率很小, 使得图像特征提取和识别难度很大且效果不佳。因此采用Bi-Liner二维线性
设插值后的新图中的每个像素点坐标的灰度值为G
这样新图的每个像素点都是由原图中相邻
文档评论(0)