基于Python的简单验证码识别.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基基于于Python的的简简单单验验证证码码识识别别

摘要:验证码在⽹络安全⽅⾯发挥着关键作⽤,验证码的主要⽬的是分⼈类和计算机,⽤来防⽌⾃动化脚本对⽹站的⼀些恶意⾏为。⽬前

绝⼤多数⽹站都利⽤验证码来阻⽌恶意脚本程序的⼊侵。验证码经过图像的预处理字符分割,匹配识别等步骤来完成对字符验证的处理,后

进过特征提取与匹配等操作完成对⼀个验证码的识别。本⽂选取了⼀个⽹站进⾏⽹站登录的验证码识别,识别结果取得了预期的效果,较好

的识别出了验证码。

关键字:验证码;图像识别;Python;预处理

Abstrat:CAPTCHAplaysakeyroleinnetworksecurity,ThemainpurposeoftheCAPTCHAistodifferentiatebetweenhumansand

computers,topreventsomemaliciousbehaviorfromautomatingscriptsonthesite.Atpresent,mostwebsitesuseAuthenticodetoprevent

theintrusionofmaliciousscriptprograms.Theverificationcodepassesthepreprocessingcharactersegmentationoftheimage,the

matchingrecognitionandsooncompletestheprocessingtothecharacterverification,thebackwardfeatureextractionandthematching

operationcompletestotheverificationcoderecognition.nthispaper,awebsiteisselectedtoidentifytheverificationcode,theresult

obtainedtheexpectedresults,abetteridentificationoftheverificationcode.

Keywords:CAPTCHA;magerecognition;Python;Pretreatment;

0.引引⾔⾔

验证码是⽬前互联⽹上⼀种⾮常重要⾮常常见的安全识别技术,先引⽤⼀段来⾃wiki的关于验证码的描述:“全⾃动分计算机和⼈类的公开

图灵测试(CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart,简称CAPTCHA)[1],俗称验证码,是⼀种

分⽤户是计算机和⼈的公共⾃动程序。在CAPTCHA测试中,作为服务器的计算机会⾃动⽣成⼀个问题由⽤户来解答。这个问题可以由计算

机⽣成并判定,但是必须有⼈类才能解答。由于计算机⽆法解答CAPTCHA的问题,所以回答出问题的⽤户就可以被认为是⼈类。”验证码最

初是为了防⽌⼀些暴⼒破解的存在,但是后来随着技术的发展,特别是图像识别技术的发展,验证码的识别变的简单,本⽂介绍了⼏种常见

且普遍的验证码的识别。

常见的验证码有⼏类,第⼀种四位数字,随机的⼀串数字,⼏乎没有验证作⽤,第⼆种是GF格式的随机数字图⽚验证码,字符中规中矩,

验证效果⼀般。第三种是PNG格式,随机数字+随机⼤⼩写字母,识别难度较⼤。第四种是JPG格式,随机数字+随机颜⾊+随机位置+随机

长度,难度较⼤。

1.Python简简介介

Python是⼀种粘性语⾔,其具有良好的简洁性、易读性以及可维护性。本⽂使⽤的PL库是Python的⼀种图形识别库。

Python是纯粹的⾃由软件,源代码和解释器CPython遵循GPL(GNUGeneralPubliclicense)协议。Python语法简洁清晰,特⾊之⼀是强

制⽤空⽩符作为语句缩进。

Python具有丰富和强⼤的库。它常被昵称为能够把⽤其他语⾔制作的各种模块(尤其是/)很轻松地联结在⼀起。常见的⼀种应⽤情形是,

使⽤Python快速⽣成程序的原型(有时甚⾄是程序的最终界⾯),然后对其中有特别要求的部分,⽤更合适的语⾔改写,⽐如中的图形渲染

模块,性能要求特别⾼,就可以⽤重写,⽽后封装为Python可以调⽤的扩展类库。需

文档评论(0)

A~下一站守候 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档