- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抢票软件“缠斗”12306
今年的春节抢票大战,12306让很多乘客傻了眼:图片验证码以抽风的方式呈现,橘子VS橙子、公交卡VS信用卡、大蒜 VS蒜苗,傻傻分不清。有乘客直呼,“不当学霸,连车票都没法买了。”与购票者的“傻白甜”相比,抢票软件阵营却越挫越勇,任你千变万化,我自有破垒神功。 扎在头上的红领巾
“我选过很多稀奇古怪的图。有一次选红领巾,里面有张图是一个人把红领巾扎在头上,这个也是正确选项。可是我没选,谁能意识到红领巾是扎在头上的啊?”抢了三天票没抢到的小马,提起12306的验证码,就有一肚子槽要吐。还有一次,要求从八张图中选出所有的盆栽,里面有一株大葱,插在篮子里。由于图片分辨率不是很高,白色的篮子看起来就像是个花盆,小马点了这株大葱,于是眼看到手的火车票又飞了。
更让他懊恼的是,有好几次明明看上去选对了,但网页就是提示验证错误。根据12306的系统程序,如果验证码错误的话,本来应该显示用户到底哪一张没有选对,但每到这一步验证码区域就变成一片空白。“连自己错在哪儿都不知道。”
小马把今年能遇到的bug几乎全遭遇了一遍,“好不容易成功通过了验证,票却一张都没了,连站票数都是0。”
数次刷票不成功,气馁的小马把目光投向了电话订票。但步骤繁琐,等他好不容易打通电话时,订票系统却告诉他已经没票了。这时,距离他之前查看余票数量一百余张,刚过去两分钟。 “误伤”乘客
12306的初衷是对付黄牛。“抢票工具必须通过验证码进入账户,所以升级验证码是我们阻止抢票工具的重要手段。这一次更换,需要人工辨认彩图,机器自动登录也就会遇到障碍。”12306官网工作人员在接受《新京报》采访时称。
记者发现,早在今年3月16日,验证码就已经将简单的数字加字母换成了随机图片,用户须点击所有符合条件的图片才能通过验证,而且有时是单选,有时是多选。
相对于字母、数字而言,图片是一种令人类更加难以辨识的验证码。这种在多种图片中找同类的方法本身没有问题,只是其分类方法由机器来确定,因此有可能会出现人类判断与机器分类不符的现象。
但是,识别图片对于机器来说却不比数字更困难,即使是解读数字验证码,机器也需要把画有数字的图片转化为文本。而识别图形验证码的方式有两种,一种是准备一个庞大的图库,将图片和关键字对应,然后在后台进行关键字对比;另一种是根据关键字启动图片搜索,只要图片在搜索结果中,就显示符合条件。
“几乎不存在一种由机器生成,人眼识别快、机器识别慢的东西。”专业人士称。12306的“变态”验证码初衷是为了抵挡抢票软件,但最终却只是增加了人类识别的难度。360公司的分析数据显示,用户一次性成功输入验证码的比例仅为8%,两次成功的比例为27%,65%的用户需要三次甚至四次以上才能输对。
然而,没过多久,不少抢票软件开发商纷纷宣布,图片验证的难关已经被攻破。 336980道题目
早在春运前的一个多月,贾子健和他所在团队就进入到了封闭模式,潜心针对今年的抢票软件进行攻坚。这支队伍有20来号人,有三位是图片处理领域的专职人员。
邱学侃是这三位中的一位。他告诉记者,12306换成图形验证码伊始只有80多种图片,十分简单。但作为专门开发抢票软件的程序员,他敏感地意识到,12306不可能只依靠这点图片来应付庞大的春运需求,一定有一部分图是隐藏起来的,要等到春运时才会放出来。因此,在接到今年的开发任务之前,他预料到会有一场硬仗要打。
果不其然,春运订票开始的两三天之后,12306验证码图片类型猛增。据360统计,如今的验证码图形种类达到了581种,组合起来是336980道题目。
但是对于他们来说,图片验证码的识别原理并不难,主要依靠的是机器的深度学习和图片识别技术。先借助网络搜索软件的优势,将验证码系统中的图片从图库中找出来,一一进行关键词匹配。之后,当屏幕上出现这张图片时,只需要一到两秒时间,图片便与关键词联系在一起,进而会轻易识别出来。
据贾子健介绍,通过这项技术,买票成功率能提高50%。
为防止黄牛抢票,12306又给破解增加了一些难度,额外叠加了其他的障碍。比如,在登录时,要输入的验证码是一个词对应一种图片,到了下单步骤时,则成了多个词对应多种图片,如“请选出下图的狮子和花朵”等等。另外还给图片增加了斜视图、正视图、放大图、缩小图等不同种类视图,希望借此阻挡恶意刷票行为。
事实上,这些附加障碍虽然给识别验证码增加了难度,却只是针对普通用户而言。在抢票软件识别过程中,无论原图上增加了多少背景,程序员只需先给图片进行一遍降噪或模糊识别,兜了一小圈之后,就又跟普通的验证码没有区别了。 “相爱相杀”
互联网公司与12306之间的技术争霸赛由来已
您可能关注的文档
- 我的战友葛大明.doc
- 我的朋友太霸道.doc
- 我的歌词创作梦.doc
- 我的母亲没有皱纹.doc
- 我的游戏我做主.doc
- 我的物理学习路.doc
- 我的阅读生活.doc
- 我省建筑高技能人才培养资源现状分析.doc
- 我院应用两种方法对胃溃疡的治疗效果分析.doc
- 我院护士论文发表率低的原因分析与探讨.doc
- 2024年中国钽材市场调查研究报告.docx
- 2024年中国不锈钢清洗车市场调查研究报告.docx
- 2024年中国分类垃圾箱市场调查研究报告.docx
- 2024年中国水气电磁阀市场调查研究报告.docx
- 2024年中国绿藻片市场调查研究报告.docx
- 2010-2023历年初中毕业升学考试(青海西宁卷)数学(带解析).docx
- 2010-2023历年福建厦门高一下学期质量检测地理卷.docx
- 2010-2023历年初中数学单元提优测试卷公式法(带解析).docx
- 2010-2023历年初中毕业升学考试(山东德州卷)化学(带解析).docx
- 2010-2023历年初中毕业升学考试(四川省泸州卷)化学(带解析).docx
文档评论(0)