爬取拉勾网,并进行数据分析.pdfVIP

  • 2
  • 0
  • 约8.08千字
  • 约 8页
  • 2023-08-21 发布于上海
  • 举报
爬取拉勾⽹,并进⾏数据分析 拉勾⽹是现在互联⽹招聘⽐较⽕热的⼀个⽹站,本篇⽂章主要是爬取拉勾⽹“数据分析师”这个岗位,并且对所爬取到的信息,进⾏数据分 析。 数据采集 拉勾⽹的岗位信息主要是⽤json⽂件存储,在position这个json⽂件中,我们找到了所需要的岗位信息 接着便开始写爬⾍了: # -*- coding: UTF-8 -*- import json import requests headers = { Cookie: Host: , Origin: , Referer: /jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?labelWords=fromSearch=truesuginput=, User-Agent: post_data = {first: false, kd:数据分析师 }#这是请求⽹址的⼀些参数 def start_requests(pn): html = requests.post(myurl + str(pn), data=post_data, headers=headers, verify=False) html_text = html.

文档评论(0)

1亿VIP精品文档

相关文档