- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
shape context应用
shape context 的应用 13.12.2 常见应用 1.验证码识别。 2.人脸匹配。 3.步态识别。 验证码识别 验证码是近几年发展起来的技术, 主要是用来防止网络机器人的一些恶意行为,即区分人和电脑。 验证码图片识别有很多干扰因素。图1 展示了Msn 和Yahoo的验证码图像,它们对于阻止网络机器人都是非常有效的。 验证码识别 从中我们可以发现优秀的验证码图像的几个特点: 1.字符存在变形、仿射变换、缩放。 2. 图像中存在干扰线。 3. 一般存在6 个以上的字符需要识别。 验证码识别 上述三个特点都给识别增加了难度。通常的验证码识别需要以下三个步骤。 1. 图像进行二值化和细化处理。 2. 去除干扰线, 并进行图像切割, 使得切割后的每幅图像只包含一个字符。 3. 特征提取和单个字符识别。 验证码识别 步骤1 很简单,步骤2过巧妙的设计, 也能够使分割正确率达到很高的水平。(但分割后的单个字符图像中, 还是不可避免的存在着干扰线。这不是本次讨论重点, 不做详细说明。)本文着重讨论的是步骤3 , 单个字符的识别。这里,我们采用了形状上下文的方法。 验证码识别—— 形状上下文 对于一幅二值图像, 黑点表示字符, 白点表示空白, 这样我们就可以用一组黑点集合来表示一幅图像, 即一幅图像可以表示为集合P={P1,…,Pn}, 图2(a)(b)展示了图像上的点的例子。我们取了这两幅图像上的三个点A、B、C, 然后用下页图所示的对数极坐标来重新表示这三个点, 就得到了图2(d)(e)(f)。 验证码识别—— 形状上下文 验证码识别—— 形状上下文 上图是以该点为极坐标中心,对于每一个由r和θ确定的极坐标区域, 如果该区域内包含的点越多, 则其在由θ和logr组成的直角坐标系中对应的区域颜色越深(点A、C所对应的直角坐标系图很相似。) 这里使用的是由12个角度和5个环组成的对数极坐标系, 得到的是有60个区域的直角坐标系, 每个区域的值大小不同。这样原图每个点都可以对应一个维数为60的向量。 SergeBelongie和JitendraMali 把这个向量称为点对应的形状上下文。 验证码识别—— 形状上下文 对于两幅比较图像, 如果分别得到了每幅图像上每一个点的形状上下文, 就可以计算两幅图中任意两个点的距离。假设两个点pi、qj, 它们的形状上下文分别为hi={hi(1),…,hi(K)},hj={hj(1),…,hj(K)}, 可以通过下面的公式来计算两点之间的距离Ci,j 验证码识别—— 形状上下文 得到了两幅图像任意两个点的距离, 下面就是要找到两幅图像的点的一个对应关系j=π(i), 使得 最小。这个问题可以用hungarian方法在O(n3)的时间复杂度内解出来。这中间可能会碰到两幅图像的点数不一致的问题, 这可以通过增设“虚点”的方法来解决。 验证码识别—— 形状上下文 运行一个最优匹配算法(如匈牙利算法等)找个一个最优匹配,使整个代价最小,最后基于这个最优匹配,得到整个形状代价,这个可以作为两个形状之间的差别衡量,代价越小,形状越相似。形状代价如下: 验证码识别—— 形状上下文 不过到这里还只是找到一个对应关系而已,需要进一步用一个变换 T 来衡量形状之间的转变,所以,最后的形状距离可以用估计的变换来表示,如下: 最后基于这个形状距离可以基本衡量两个物体形状之间的区别。(二者采样点数目可能不同,故两边都得逐一匹配) 验证码识别——应用图形上下文进行字符识别 1.建立样本字符库。 2.验证码图像识别。 验证码识别——应用图形上下文进行字符识别 建立样本字符图库 用字体TimesNew Roman做了每个字符的图像示例, 并设置每幅图像的大小为21×21, 单位为像素。对每个样本字符图像进行二值化和细化处理,得到了样本字符图库。 验证码识别——应用图形上下文进行字符识别 验证码图像实别: 假设我们已经得到了经过切割后的图像。图3展示了这一些典型测试图像示例, 为了形象, 第一行是原图像, 第
文档评论(0)