- 3
- 0
- 约2.31千字
- 约 5页
- 2026-06-02 发布于山东
- 举报
单元07Python爬虫基础教案
课程名称:Python基础与大数据应用
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时
总学分:4.0学分
本章学时:10学时
一、材料清单
《Python基础与大数据应用》教材
urllib、requests、re、lxml示例代码
网页文本爬取、图片爬取源码
项目实战:爬取人邮教育社区图书信息
拓展训练:爬取新华网科技栏目新闻与图片
课堂练习、上机任务、单元习题
二、教学目标与基本要求
1.教学目标
理解网络爬虫的结构、原理与合法使用规范;熟练掌握Python内置模块urllib与第三方库requests;掌握正则表达式与XPath数据提取方法;掌握lxml解析库;能够独立编写爬虫程序爬取网页文字、链接、图片并保存至本地;具备规范、安全、合法的数据采集能力。
2.素质目标
法治教育核心单元:严格遵守Robots协议、网络安全法、民法典,严禁非法爬取。
强调尊重知识产权、保护隐私、尊重网站规则,树立合法爬虫理念。
引导学生用技术服务社会、服务国家,不做网络黑灰产,增强网络空间道德与法治意识。
3.基本要求
理解网络爬虫概念、类型、组成结构与工作流程。
了解八爪鱼采集器可视化爬取方法。
掌握urllib.request、urllib.parse、urllib.error模块。
掌
您可能关注的文档
- 《Python 基础与大数据应用》电子教案 单元 01 Python 环境搭建.docx
- 《Python 基础与大数据应用》电子教案 单元 02 Python 编程基础.docx
- 《Python 基础与大数据应用》电子教案 单元 03 函数与异常.docx
- 《Python 基础与大数据应用》电子教案 单元 04 面向对象编程基础.docx
- 《Python 基础与大数据应用》电子教案 单元 06 Python 文件和数据库.docx
- 《Python 基础与大数据应用》电子教案 单元 08 Python 爬虫框架.docx
- 《Python 基础与大数据应用》电子教案 单元 09 数据分析基础.docx
- 《Python 基础与大数据应用》电子教案 单元 10 pandas 数据分析.docx
- 《Python 基础与大数据应用》电子教案 单元 11 Python 可视化与可视化工具.docx
- 《Python 基础与大数据应用》教学大纲.docx
最近下载
- 广西大学《建筑物理》2024 - 2025 学年第一学期期末试卷.pdf VIP
- 内蒙古师范大学附属学校2026届学业水平考试数学试题模拟卷(十).doc VIP
- 2022年滁州城市职业学院教师招聘考试真题.docx VIP
- 三年级语文下册试题 课内阅读理解专项练习题(含答案)部编版.doc VIP
- 拒绝毒品 拥抱阳光 主题班会PPT课件.pptx VIP
- 2026新版煤矿岗位应急处置卡(按照新规范编制).docx VIP
- 多层砖混结构办公楼施工组织设计.pdf VIP
- 2026年及未来5年中国第三方运维服务行业发展监测及发展战略规划报告.docx
- 2026年安徽省蚌埠市城管协管招聘笔试备考题库及答案解析.docx VIP
- 2026年安徽省蚌埠市城管协管招聘笔试参考试题及答案解析.docx VIP
原创力文档

文档评论(0)