项目二:数据集准备;什么是爬虫
爬虫基本流程
网页基本结构;;网页的请求和响应方式是Request和Response
Request:用户将自己的信息通过浏览器(socketclient)发送给服务器(socketserver)
Response:服务器接收请求,分析用户发来的请求信息,收到请求信息后返回数据(返回的数据中可能包含其他链接,如:image、js、css等)
浏览器在接收Response后,会解析其内容来显示给用户,而爬虫程序在模拟浏览器发送请求然后接收Response后,是要提取其中的有用数据。下图为爬虫具体流程。;网页一般由三部分组成,分别是HTML(超文本标记语言)、
您可能关注的文档
- 深度学习技术应用 项目2-第2节_数据持久化存储附录-数据库安装流程.docx
- 深度学习技术应用 课件 项目1-第1节_人工智能应用开发全流程、开发环境搭建_V1.0.pptx
- 深度学习技术应用 课件 项目2-第2节_数据持久化存储_V1.0.pptx
- 深度学习技术应用 课件 项目2-第3节_图像数据标注与数据集制作_V1.0.pptx
- 2026年浙江医疗卫生笔试试题及答案.doc
- 2026年新能源电动汽车市场发展趋势报告及政策影响分析.docx
- 2026年速冻食品产业市场细分与消费者需求研究报告.docx
- 2026年智能家居市场分析报告:消费者需求与市场潜力.docx
- 2025年拉萨市城关区税务系统人员招聘考试试题及答案解析.docx
- 2026年新能源汽车充电设施建设报告及行业发展趋势.docx
原创力文档

文档评论(0)