抢票软件“缠斗”12306.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抢票软件“缠斗”12306   今年的春节抢票大战,12306让很多乘客傻了眼:图片验证码以抽风的方式呈现,橘子VS橙子、公交卡VS信用卡、大蒜 VS蒜苗,傻傻分不清。有乘客直呼,“不当学霸,连车票都没法买了。”与购票者的“傻白甜”相比,抢票软件阵营却越挫越勇,任你千变万化,我自有破垒神功。 扎在头上的红领巾   “我选过很多稀奇古怪的图。有一次选红领巾,里面有张图是一个人把红领巾扎在头上,这个也是正确选项。可是我没选,谁能意识到红领巾是扎在头上的啊?”抢了三天票没抢到的小马,提起12306的验证码,就有一肚子槽要吐。还有一次,要求从八张图中选出所有的盆栽,里面有一株大葱,插在篮子里。由于图片分辨率不是很高,白色的篮子看起来就像是个花盆,小马点了这株大葱,于是眼看到手的火车票又飞了。   更让他懊恼的是,有好几次明明看上去选对了,但网页就是提示验证错误。根据12306的系统程序,如果验证码错误的话,本来应该显示用户到底哪一张没有选对,但每到这一步验证码区域就变成一片空白。“连自己错在哪儿都不知道。”   小马把今年能遇到的bug几乎全遭遇了一遍,“好不容易成功通过了验证,票却一张都没了,连站票数都是0。”   数次刷票不成功,气馁的小马把目光投向了电话订票。但步骤繁琐,等他好不容易打通电话时,订票系统却告诉他已经没票了。这时,距离他之前查看余票数量一百余张,刚过去两分钟。 “误伤”乘客   12306的初衷是对付黄牛。“抢票工具必须通过验证码进入账户,所以升级验证码是我们阻止抢票工具的重要手段。这一次更换,需要人工辨认彩图,机器自动登录也就会遇到障碍。”12306官网工作人员在接受《新京报》采访时称。   记者发现,早在今年3月16日,验证码就已经将简单的数字加字母换成了随机图片,用户须点击所有符合条件的图片才能通过验证,而且有时是单选,有时是多选。      相对于字母、数字而言,图片是一种令人类更加难以辨识的验证码。这种在多种图片中找同类的方法本身没有问题,只是其分类方法由机器来确定,因此有可能会出现人类判断与机器分类不符的现象。   但是,识别图片对于机器来说却不比数字更困难,即使是解读数字验证码,机器也需要把画有数字的图片转化为文本。而识别图形验证码的方式有两种,一种是准备一个庞大的图库,将图片和关键字对应,然后在后台进行关键字对比;另一种是根据关键字启动图片搜索,只要图片在搜索结果中,就显示符合条件。   “几乎不存在一种由机器生成,人眼识别快、机器识别慢的东西。”专业人士称。12306的“变态”验证码初衷是为了抵挡抢票软件,但最终却只是增加了人类识别的难度。360公司的分析数据显示,用户一次性成功输入验证码的比例仅为8%,两次成功的比例为27%,65%的用户需要三次甚至四次以上才能输对。   然而,没过多久,不少抢票软件开发商纷纷宣布,图片验证的难关已经被攻破。 336980道题目   早在春运前的一个多月,贾子健和他所在团队就进入到了封闭模式,潜心针对今年的抢票软件进行攻坚。这支队伍有20来号人,有三位是图片处理领域的专职人员。   邱学侃是这三位中的一位。他告诉记者,12306换成图形验证码伊始只有80多种图片,十分简单。但作为专门开发抢票软件的程序员,他敏感地意识到,12306不可能只依靠这点图片来应付庞大的春运需求,一定有一部分图是隐藏起来的,要等到春运时才会放出来。因此,在接到今年的开发任务之前,他预料到会有一场硬仗要打。   果不其然,春运订票开始的两三天之后,12306验证码图片类型猛增。据360统计,如今的验证码图形种类达到了581种,组合起来是336980道题目。   但是对于他们来说,图片验证码的识别原理并不难,主要依靠的是机器的深度学习和图片识别技术。先借助网络搜索软件的优势,将验证码系统中的图片从图库中找出来,一一进行关键词匹配。之后,当屏幕上出现这张图片时,只需要一到两秒时间,图片便与关键词联系在一起,进而会轻易识别出来。   据贾子健介绍,通过这项技术,买票成功率能提高50%。   为防止黄牛抢票,12306又给破解增加了一些难度,额外叠加了其他的障碍。比如,在登录时,要输入的验证码是一个词对应一种图片,到了下单步骤时,则成了多个词对应多种图片,如“请选出下图的狮子和花朵”等等。另外还给图片增加了斜视图、正视图、放大图、缩小图等不同种类视图,希望借此阻挡恶意刷票行为。   事实上,这些附加障碍虽然给识别验证码增加了难度,却只是针对普通用户而言。在抢票软件识别过程中,无论原图上增加了多少背景,程序员只需先给图片进行一遍降噪或模糊识别,兜了一小圈之后,就又跟普通的验证码没有区别了。 “相爱相杀”   互联网公司与12306之间的技术争霸赛由来已

文档评论(0)

sis_lxf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档