《数据采集技术》课件——Urllib-error-与-parse-处理模块.pptxVIP

  • 0
  • 0
  • 约2.11千字
  • 约 13页
  • 2026-04-29 发布于福建
  • 举报

《数据采集技术》课件——Urllib-error-与-parse-处理模块.pptx

项目二

动态网页数据采集

目录Content1使用Requests库完成“浪潮云说”网页数据采集2使用Urllib模块完成“新闻动态”网页数据采集

项目导言零在实际的开发中,所需数据是各种各样的,虽然在网络上有许多开源的数据集,但开源的数据集不一定符合我们的项目需求,因此项目需要的数据集需要主动获取。数据采集是数据分析必不可少的一环,这个时候学会数据采集的方法就显得尤为重要,本项目将使用Python相关http请求库完成网页数据的采集。

学习目标零知识目标了解Urllib和Requests库相关概念熟悉Urllib和Requests库的方法掌握Urllib库中request模块使用精通动态网页数据采集的方法技能目标具备Urllib库相关模块的使用能力具备安装Requests库的能力具备使用Requests库完成网页数据采集的能力具备精通网页数据采集的能力素养目标具备善于发现和总结问题能力具备较强的学习能力和适应能力具备较强的沟通表达能力

任务1:使用Urllib模块完成“新闻动态”网页数据采集壹request模块任务技能urlopen()、Request()、urlretrieve()error模块URLError、HTTPErrorparse模块urlparse()、urljoin()、quote()、unquote()

任务2-1:使用Urllib模块完成“新闻动态”网页数

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档