《Python 基础与大数据应用》电子教案 单元 07 Python 爬虫基础.docxVIP

  • 3
  • 0
  • 约2.31千字
  • 约 5页
  • 2026-06-02 发布于山东
  • 举报

《Python 基础与大数据应用》电子教案 单元 07 Python 爬虫基础.docx

单元07Python爬虫基础教案

课程名称:Python基础与大数据应用

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时

总学分:4.0学分

本章学时:10学时

一、材料清单

《Python基础与大数据应用》教材

urllib、requests、re、lxml示例代码

网页文本爬取、图片爬取源码

项目实战:爬取人邮教育社区图书信息

拓展训练:爬取新华网科技栏目新闻与图片

课堂练习、上机任务、单元习题

二、教学目标与基本要求

1.教学目标

理解网络爬虫的结构、原理与合法使用规范;熟练掌握Python内置模块urllib与第三方库requests;掌握正则表达式与XPath数据提取方法;掌握lxml解析库;能够独立编写爬虫程序爬取网页文字、链接、图片并保存至本地;具备规范、安全、合法的数据采集能力。

2.素质目标

法治教育核心单元:严格遵守Robots协议、网络安全法、民法典,严禁非法爬取。

强调尊重知识产权、保护隐私、尊重网站规则,树立合法爬虫理念。

引导学生用技术服务社会、服务国家,不做网络黑灰产,增强网络空间道德与法治意识。

3.基本要求

理解网络爬虫概念、类型、组成结构与工作流程。

了解八爪鱼采集器可视化爬取方法。

掌握urllib.request、urllib.parse、urllib.error模块。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档