《数据采集技术》课件——项目二 任务1 使用正则表达式.pptxVIP

  • 0
  • 0
  • 约2.41千字
  • 约 23页
  • 2026-03-05 发布于福建
  • 举报

《数据采集技术》课件——项目二 任务1 使用正则表达式.pptx

项目二:爬取豆瓣电影网站

目录01任务1使用正则表达式02任务2:使用Xpath爬取豆瓣电影排行榜03任务3:使用BeautifulSoup爬取豆瓣电影TOP250

任务1:使用正则表达式

任务描述初次爬取的网页数据大多是以HTML源代码形式返回到我们的爬虫程序中的,当我们需要从爬取到的源代码中获取到具体所需数据时,就需要用到相应的解析工具了,正则表达式就是众多解析工具中的一个。正则表达式在引入re模块后以字符串前加r的形式存在,通过正则表达式的特殊字符就可以从杂乱的数据中获取到所需的数据。

任务目标了解正则表达式的基本格式0201了解正则表达式的基本概念使用re输出文章中

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档