《Python网络爬虫基础教程》课件 第2章 网页请求原理.pptxVIP

  • 0
  • 0
  • 约5.47千字
  • 约 127页
  • 2026-05-21 发布于山东
  • 举报

《Python网络爬虫基础教程》课件 第2章 网页请求原理.pptx

第2章网页请求原理;学习目标/Target;章节概述/Summary;目录/Contents;浏览器加载网页的完整过程;;;2.1浏览器加载网页过程;HTTP基础;;2.2.1URL简介;2.2.1URL简介;2.2.1URL简介;2.2.1URL简介;2.2.1URL简介;2.2.1URL简介;2.2.1URL简介;;当用户通过浏览器访问网站时,浏览器会向目标Web服务器发送请求,Web服务器接收并处理请求后,将响应结果返回浏览器。为了保证在浏览器和Web服务器之间传输数据的可靠性,浏览器和Web服务器必须遵守特定的通信协议。网络爬虫在抓取网页数据时,主要使用的是HTTP和HTTPS这两种协议。;HTTP用于在Web服务器和浏览器之间传输超文本资源。该协议采用请求-响应模式,能够高效、准确地完成超文本资源的传输。不过,HTTP协议采用无连接的设计方式,每次连接只能处理一个请求,服务器返回响应后立即断开连接,后续请求需要重新建立新的连接。;HTTPS协议在HTTP的基础上增加了安全套接字层(SecureSocketLayer,SSL),数据在传输过程中主要通过数字证书、加密算法、非对称密钥等技术完成互联网数据传输加密,实现互联网传输的安全保护。;;2.2.3HTTP请求格式;2.2.3HTTP请求格式;2.2.3HTTP请求格式;2.2.3HTTP

文档评论(0)

1亿VIP精品文档

相关文档