- 1
- 0
- 约2.88千字
- 约 29页
- 2026-04-30 发布于福建
- 举报
实现个人微博的爬取
目录01任务1使用Ajax实现个人微博的爬取02任务2:使用Selenium实现自动化爬取
任务二:使用Selenium实现自动化爬取
任务描述JavaScript动态渲染的页面不止Ajax这一种。有些网页是由JavaScript生成的,并非原始HTML代码,类似淘宝这种页面,它即使是Ajax获取的数据,但是其Ajax接口含有很多加密参数,我们难以直接找出其规律,也很难直接分析Ajax来抓取。因此,直接模拟浏览器的运行,绕过这个过程,做到在浏览器中看到是什么样,抓取的源码就是什么样,也就是“可见即可爬”,不用再去管网页内部的JavaScript用了什么算法渲染页面,不用管网页后台的Ajax接口到底有哪些参数。
2、能配置selenium自动化环境3、掌握selenium库的基本使用1、会安装对应浏览器驱动任务目标
任务二使用Selenium实现自动化爬取2.1Selenium概述Selenium?是一个用于Web应用程序自动化测试的工具。它可以直接在浏览器中运行,就像用户在浏览器中操作一样。其支持多种浏览器,包括IE、Firefox、Chrome、Safari等。对于一些JavaScript动态渲染的页面来说,此种抓取方式非常有效。2.2Selenium环境配置1.配置对应浏览器驱动
您可能关注的文档
- 《数据库技术与应用1》课件——创建视图.pptx
- 《数据库技术与应用1》课件——创建数据表.pptx
- 《数据库技术与应用1》课件——创建数据库.pptx
- 《数据库技术与应用1》课件——创建索引.pptx
- 《数据库技术与应用1》课件——存储过程的应用.pptx
- 《数据库技术与应用1》课件——服务器安全的管理.pptx
- 《数据库技术与应用1》课件——管理触发器.pptx
- 《数据采集技术》课件——项目二 任务2 使用Xpath爬取豆瓣电影排行榜.pptx
- 《数据采集技术》课件——项目四 任务1 使用Ajax实现个人微博的爬取.pptx
- 《数据采集技术》课件——项目五 任务1 获取某电影网站的Cookie.pptx
最近下载
- 小学英语Unit 7 Chinese festivals 课件.pptx VIP
- 2025年湖北水利电力工程技术职务水平能力测试(农业水利工程专业理论知识)历年参考题库含答案详解.docx VIP
- 2026年医疗救护员-理论知识考试历年参考题库含答案详解.docx VIP
- 2026大学生西部计划志愿者招募笔试试题库及答案.docx VIP
- 山东省烟台市牟平区2025-2026学年九年级下学期(五四学制)期中数学试卷(含答案).pdf
- 2026年职业技能鉴定考试(医疗护理员/医疗救护员)历年参考题库含答案详解.docx VIP
- 四川大学《计算机组成原理》2021-2022学年期末试卷.docx VIP
- 大疆Mavic 系列:DJI Air 2S 用户手册说明书 v1.0(含DJI Air 2S DLog-M to Rec.709 LUT 用户手册).pdf VIP
- 【新教材】Unit 6 Rain or Shine Section B(1a—1d)课件-人教2025版七年级下册英语(内嵌音频+视频).pptx VIP
- 汉庭工程标准.docx
原创力文档

文档评论(0)