项目 12 爬虫基础教案 (1).docxVIP

  • 1
  • 0
  • 约1.67千字
  • 约 3页
  • 2026-01-20 发布于广东
  • 举报

序号:23

章节名称

项目12爬虫基础(一)

教学课时

2

授课班级

人工智能2501、2502

授课时间

授课地点

教学目标

知识目标

理解爬虫的基本概念和原理,掌握Python爬虫的基本技能。

了解HTML基础结构,掌握发起HTTP请求和发送POST请求的方法。

掌握网页内容的解析方法,了解正则表达式的使用。

能力目标

1.能够使用urllib库发送HTTP请求、伪装浏览器获取网页内容。2.能够从网页内容中解析出所需的文字信息,并保存到文件中。

素质目标

1.培养对网络数据结构的敏感性,提升数据获取的主动性。

2.养成遵守网络爬虫伦理规范的习惯,确保爬取过程合法合规。

教学内容

主要内容

1.1.爬虫简介

-爬虫的基本概念、原理及应用场景。

-HTML基础结构,包括各标签的含义和作用。

-发起HTTP请求和发送POST请求的方法,使用urllib库实现网页内容获取。

2.爬取文字

-获取网页内容的具体步骤和方法。

-解析网页文件,定位所需信息的位置。

-使用正则表达式提取新闻主题名称等文字信息。

-将提取的文字信息保存到TXT文件中。

重点

爬虫的基本原理和HTTP请求的发送方法。

网页内容的解析和正则表达式的应用。

难点

1.准确找到网页中所需信息对应的源码位置。

2.正则表达式的正确编写以精准提取信息。

教法改革

教学方法

讲授法、演示法、实操法、案例分析法

教学手段

多媒体教学、编程环境实操、任务驱动练习

教学反思

作业及学习评价表

学习评价表

评价内容

自评

同桌评

师评

能掌握爬虫的基本概念和应用场景

能熟悉HTTP基础结构

能掌握网页内容的文字爬取与解析

能积极回答教师的提问

能积极参与小组讨论

评价指标

A.优秀B.一般C.较差

二、教学设计

教学步骤

教学内容与情境设计

教师活动

学生活动

时间分配

情境导入

结合学生获取互联网信息的场景,如阿曹想通过爬虫获取感兴趣的信息,引出爬虫的概念和学习的必要性?

【课程思政】激发学生对技术的探索欲望,培养解决实际问题的意识

引入场景、提问、明确目标

思考问题,了解任务核心

5分钟

知识讲解1

爬虫简介:讲解爬虫的概念、原理、应用场景,HTML基础结构,发起HTTP请求和发送POST请求的方法,结合实例演示使用urllib库获取网页内容。

PPT讲解、代码演示

记录要点,观察演示

15分钟

知识讲解2

讲解获取网页内容的具体步骤与方法。

如何解析网页文件,同时如何定位到所需信息的位置

【课程思政】培养严谨态度,注重规则理解

PPT讲解、代码演示

记录要点,观察演示

15分钟

实操演练

练习:使用urllib库获取指定网站(如安防学院官网)的内容,尝试伪装浏览器进行访问。

【课程思政】锻炼动手能力,体会理论应用于实践

巡回指导,解决代码问题、函数调用问题

编写代码,运行调试,记录遇到的问题

15分钟

知识讲解3

1.爬取文字:讲解获取网页内容、解析网页文件、使用正则表达式提取文字信息以及保存文字信息的方法,结合校园新闻爬取实例进行演示。

【课程思政】培养逻辑思维,理解运算规则的重要性

讲解算法模型,演示表达式计算

编写代码,运行调试,记录遇到的问题

10分钟

实操演练

练习:选取学校网站中感兴趣的文字内容(如校园时讯),进行爬取并保存到TXT文件中。

【课程思政】提升问题解决能力,感受编程实用性

指导学生处理算法模型参数、函数导入等问题

记录算法特点和评估方法,分析案例中分类结果的优劣,思考如何改进。

15分钟

总结与作业

1.总结核心知识点,包括爬虫原理、HTTP请求、网页解析和文字提取保存。

2.布置作业:爬取另一个感兴趣网站的文字信息并保存,提交代码和结果文件。

【课程思政】强调知识巩固,培养自主学习习惯

总结重点,明确作业要求

回顾内容,记录作业任务

5分钟

文档评论(0)

1亿VIP精品文档

相关文档