项目二:数据集准备;什么是爬虫
爬虫基本流程
网页基本结构;;网页的请求和响应方式是Request和Response
Request:用户将自己的信息通过浏览器(socketclient)发送给服务器(socketserver)
Response:服务器接收请求,分析用户发来的请求信息,收到请求信息后返回数据(返回的数据中可能包含其他链接,如:image、js、css等)
浏览器在接收Response后,会解析其内容来显示给用户,而爬虫程序在模拟浏览器发送请求然后接收Response后,是要提取其中的有用数据。下图为爬虫具体流程。;网页一般由三部分组成,分别是HTML(超文本标记语言)、
您可能关注的文档
- 深度学习技术应用 课件全套 耿韶光 项目1--5 基于深度学习的动物图片分类与识别开发环境的搭建---前端界面开发.pptx
- 深度学习技术应用 课件 项目三:动物识别模型开发.pptx
- 深度学习技术应用 课件 项目四:模型调用服务端开发.pptx
- 深度学习技术应用 课件 项目五:前端界面开发.pptx
- 深度学习技术应用 教案 项目2 数据的准备.doc
- 深度学习技术应用 教案 项目3 动物识别模型的开发.doc
- 深度学习技术应用 教案 项目4 模型调用服务端的开发.doc
- 深度学习技术应用 教案 项目5 动物识别项目的开发.doc
- 深度学习技术应用 教案全套 耿韶光 项目1 --5 基于深度学习的动物图片分类与识别开发环境的搭建---动物识别项目的开发.doc
- 2024-2025年柔性电路板行业全景调研与投资规划分析.pptx
原创力文档

文档评论(0)