关于验证码识别的图像预处理研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于验证码识别的图像预处理研究

验证码识别的预处理的研究 Myau-Tsai Pan, Software Engineering 2013,CS School of ZJUT 摘要: 随着互联网的发展,网络给人们提供了丰富的资源,与此同时,网络的安全问题也日渐突出。为了保证网络的 安全性也为了防垃圾信息,各大网站都投入了大量的人力物力来研究验证码生成技术,以提高网站的安全性和 抗攻击的能力。本文通过对本校社团联盟优秀社团投票系统的验证码识别,提出一种改进传统验证码识别预处 理中中值滤波和均值滤波的阈值优化,最后通过测试统计验证了方法的有效性和可靠性。 关键词: 验证码,灰度化, 图像去噪, 中值滤波,二值化 Abstract: With the development of the Internet, the network provides people with a wealth of resources, at the same time, network security has become more prominent. In order to ensure network security and to prevent spam, the major sites have invested a great deal of manpower and resources to study the verification code generation technology to improve site security and anti-attack ability. Through to a voting system verification code identification, the article puts forward an improved traditional verification code identification pretreatment of optimization algorithm, and finally verified by test statistics efficiency and reliability. Key words: Authentication code,Gray-scale,Image denoising, Median filtering, Thresholding 1.引言 验证码的英文CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart) 这个 词最早是在2000 年由卡内基梅隆大学的Luis von Ahn、Manuel Blum、Nicholas J.Hopper 以及IBM 的John Langford 所提出。是一种区分用户是计算机和人的公共全自动程序。这个问题可以由计算机生成并评判,但是必须只有 人类才能解答。由于计算机无法解答CAPTCHA 的问题,所以回答出问题的用户就可以被认为是人类。[1]常见 的验证码系统在用户访问页面时产生随机的字符串,并将各字符输出在图片上,在这张图片上加上各种干扰因 素,人类通常能识别出这些字符(而机器很难识别),将这些字符反馈给服务器,服务器将其与已知的随机字符 串进行匹配来判断。随着人工智能的发展,简单的验证码很容易被 OCR 系统识别破解,因此现在实际使用的 大多数验证码都通过增加噪点,噪线,旋转,扭曲,粘连等形式来防止被破解。 2.开源文字识别Tesseract Tesseract 的OCR 引擎最先由HP 实验室于1985 年开始研发,至 1995 年时已经成为OCR 业内最准确的三款识 1 / 6 别引擎之一。然而,HP 不久便决定放弃 OCR 业务,Tesseract 也从从此尘封。数年以后,HP 意识到,与其将 Tesseract 束之高阁,不如贡献给开源软件业,让其重焕新生--2005 年,Tesseract 由美国内华达州信息技术 研究所获得,并求诸于Google 对Tesseract 进行改进、消除 Bug、优化工作。在修复了最重要的数个漏洞后, Google 两个月前认为,Tes

文档评论(0)

yaobanwd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档