- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第10卷,第3期
侵蚀您的利润网络爬虫程序对电商行业有何影响
互联网现状/安全性
目录
3 爬虫程序:良性、恶意和中性
4 报告的关键见解
5 良性爬虫程序与恶意爬虫程序的对比
6 抓取类爬虫程序的基本概念
6 抓取类爬虫程序引起关注,客户开始警觉
9 网络内容抓取的一般附带后果
9 出租抓取类爬虫程序:第三方网络内容抓取服务
11 AI僵尸网络的抓取流程
14 案例研究:网络内容抓取检测解决方案的优势
16 增强防护,抵御恶意爬虫程序
19 合规考虑因素
20 结论
21 方法
22 致谢名单
No
November2023
January2023
February2023
March2023
April2023
May2023
June2023
July2023
September2023
August2023
October2023
December2023
January2024
February2024
March2024
您知道吗?超过一半的网络流量都来自于爬虫程序。特别是商业垂直行业,由于该行业依赖Web应用程序和资产创收,因此他们受高风险爬虫程序流量的影响最大(图1)。尽管我们常常听到爬虫程序在不断进化,但当前的电子商务类企业特别关注的是网络抓取类爬虫程序,因为它们的经济影响往往隐藏在表面之下,与其他类型的爬虫程序截然不同。随着人工智能(AI)僵尸网络和无界面浏览器技术的崛起,抓取类爬虫程序越来越难以检测,也就变得极其难以躲避。举个例子,Akamai的一家电商客户在不知不觉中拦截的高达99%的高风险流量就源自于抓取类爬虫程序。
每月的爬虫程序请求数量:三大垂直行业2023年1月1日–2024年3月31日
Commerce HighTechnology FinancialServices
800B
700B
Bo
BotRequestCount
500B
400B
300B
200B
100B
0B
图1:商业是收到爬虫程序请求数量最多的垂直行业,从2023年初至2024年第一季度,全球商业垂直行业的爬虫程序流量呈现出上升趋势
因此,在这份《互联网现状》(SOTI)报告中,我们将聚焦于这些爬虫程序及其操纵者的演变与专业化趋势。尽管爬虫程序的存在由来已久,但我们依然观察到各种非法团伙在利用这种手段来实施犯罪攻击、欺诈活动以及窃取竞争情报。最近,我们观察到爬虫程序的使用呈现普遍增长的趋势,其中抓取类爬虫程序对企业造成的负面影响正在加剧。本报告旨在提供技术见解和应对策略,以加深整个商业行业对这一日益严峻问题的认识。
侵蚀您的利润:网络爬虫程序对电商行业有何影响|第10卷,第3期 2024年| 2
爬虫程序:良性、恶意和中性
每家以电商为主的大型企业都面临着爬虫程序带来的挑战,这些爬虫程序不断演变进化,变得更加专业化,以实现其攻击目的。在商业垂直行业中,存在着各种各样的爬虫程序,它们各自承担着不同的任务。为了方便理解,可以将它们分为三类:良性爬虫程序、恶意爬虫程序和中性爬虫程序。良性爬虫程序有助于客户找到您的网站。恶意爬虫程序则出于恶意目的从您的网站抓取内容。中性爬虫程序往往比较活跃,但仍然是合法的。它们实际上是良性爬虫程序的一个子类(比如频繁发送ping回显请求的合作伙伴爬虫程序或频繁发出调用请求的程序API)。
考虑到聊天机器人和搜索引擎类爬虫程序所带来的诸多益处,比如回答用户的基本问题和提供能够返回更准确搜索结果的网站内容,我们希望在控制IT成本的同时,能够优化这类爬虫程序的性能。对于那些恶意爬虫程序,比如未经授权尝试访问客户帐户以进行帐户接管的撞库爬虫程序,我们希望在不损害整体客户体验的前提下采取防范措施。近期,网络抓取类爬虫程序已成为亟待解决的一大难题,它们会导致收入减少、忠诚度下滑,以及成本不断攀升。
抓取类爬虫程序是一种用于直接从互联网的网站上提取数据和内容的僵尸网络,它非常特别。网络抓取类爬虫程序引起了人们的高度关注,因为它们的运作方式、对业务的影响以及检测难度都有别于其他爬虫程序。网络抓取类爬虫程序的应用场景也多种多样,具体取决于企业和爬虫程序操纵者如何利用这些爬虫程序收集的信息来创收。不论具体的目标为何,抓取类爬虫程序都会导致收入减少、IT成本攀升以及整体客户体验降低。
在这份SOTI报告中,我们探讨了内容抓取对电商行业的影响,并分析了为何相关的业务负责人(如数字、营销、品牌、财务、风险和安全等领域)应共同关注并采取措施来遏制滥用的抓取类爬虫程序。为了更好地摸清这些影响,我们需要深入了解网络抓取类爬虫程序
您可能关注的文档
- 2024银行业人工智能应用状况报告英文版.pdf
- 高通:2024端侧生成式AI全栈优化与应用实践报告 英文版.pdf
- 通过虚假金融木马APP进行电信欺诈的安全通报 (2) .docx
- 知道创宇基于AI的威胁检测分析技术实践.pdf
- Similarweb:针对不可预测节日季的数据驱动规划指南.pdf
- STAR Program Knowledge Guide 20241112信息安全资料 .docx
- 中国电信:2024年全球DDoS攻击态势分析报告 .docx
- Check+Point+区块链安全信息安全资料.pdf
- HTB_BIZCTF24_Report_v2信息安全资料.pdf
- 2025攻防演练必修漏洞合集.pdf
- 2025电信科技公司转型研究报告网络云自动化及人工智能的加速作用 英文版.pdf
- ISACA 认证考试指南.pdf
- 2024软件供应链管理中的威胁研究报告软件构建与维护组织所面临的主要风险 英文版 (2).pdf
- 可信数据空间建设及应用参考指南1.0.pdf
- 网易:AI加速游戏:安全治理生态 .docx
- YouGov:2025AI时代下英国消费者对网络钓鱼诈骗的担忧及代际差异研究报告 英文版 .docx
- Gartner:2025年第一季度首席信息官CIO报告最关切问题解答 英文版.pdf
- CSA云原生应用保护平台调查报告解读.pdf
- 2024全球人工智能挑战框架公约:加快国际合作以确保AI有益安全包容发展 英文版 (2).pdf
- 工业领域网络安全技术发展路径洞察报告.pdf
原创力文档


文档评论(0)