爬虫与反爬虫技术较量:从基础到图形识别动态博弈.pdf

爬虫与反爬虫技术较量:从基础到图形识别动态博弈.pdf

前言

爬虫(Spider),反爬虫(Anti-Spider),反反爬虫(Anti-Anti-Spider)之间恢

宏壮阔的斗争...

Day1

•小莫想要某站上所有的电影,写了标准的爬虫(基于HttpClient库),不断地遍历某站的电影列

表页面,根据Html分析电影名字存进自己的数据库。

•这个站点的运维小黎发现某个时间段请求量陡增,分析日志发现都是IP(xxx.xxx.xxx.xxx)这个用

户,并且user-agent还是Python-urllib/2.7,基于这两点判断非人类后直接在服务器上封杀。

Day2

文档评论(0)

1亿VIP精品文档

相关文档