- 4
- 0
- 约7.49千字
- 约 13页
- 2024-08-01 发布于湖北
- 举报
PAGE3
基于python语言下网络爬虫的技术特点与应用设计
目录
一、引言
1.1爬虫的定义
1.1.1爬虫的分类
1.1.2爬虫的性质
二、如何写一个爬虫
2.1python爬虫的结构
2.1.1爬虫调度器
2.1.2URL管理器
2.1.3网页下载器
2.1.4网页解析器
2.1.5应用程序
2.2为什么用python来写爬虫
2.3有哪些成熟的python爬虫方案
三、爬虫的目标
3.1如何选择爬虫的目标
3.2爬取网站时需要注意的地方
3.2.1Robots协议
3.2.2避免网络堵塞
3.2.3HTML的坑
3.2.4UA(用户代理)欺骗
原创力文档

文档评论(0)