- 1
- 0
- 约5.87千字
- 约 10页
- 2026-05-18 发布于北京
- 举报
*Day02回顾**
爬取思路
1、先确定是否为动态加载
2、找URL规律
3、正则表达式
4、定义程序框架,补全并测试代码
存入csv文件
持久化之MySQL
requests模块
get()
1、发请求并获取响应对象
响应对象res属性
res.text:字符串
res.encoding:字符编码res.encoding=utf-8
res.status_code:HTTP响应码
res.url:实际数据URL地址
非结构化数据保存
多级页面数据抓取
1、先爬去一级
原创力文档

文档评论(0)