python课件教案05_认识爬虫教案.docxVIP

  • 0
  • 0
  • 约4.36千字
  • 约 7页
  • 2026-03-12 发布于广西
  • 举报

PAGE

PAGE1

认识爬虫

——第5次课常规课

一、教学目标

1.知识与技能

(1)具备爬虫的基本概念;

(2)了解爬虫的种类以及工作流程;

(3)复习http和https的相关知识以及字符串的编解码方式。

2.过程与方法:

(1)通过一个个贴近生活的案例进行情景引入,激发学生对本节学习内容的兴趣,引发关联性的内容思考;

(2)每节课程开始前,对上节学习内容的知识点进行复习,加深印象;

(3)老师与学生间进行代码互动式的教学编写,带着孩子一步步完成任务。

3、情感态度与价值观:

(1)通过贴近生活的案例培养激发孩子的兴趣与爱好,在一个个生活案例中树立孩子正确的价值导向;

(2)代码的编写过程是精彩的,也是乏味的;是充满创造性的,也是一点点的基础前行;训练孩子逻辑思维、想象能力的同时,还磨练了孩子们的耐心,做到身心的锻炼。

二、教学重点、难点

【重点】爬虫的工作流程

【难点】http与https的区别;字符串的编解码转换

课时安排

课时安排:120分钟

四、上课准备

1. 课前检查所有学员电脑Python的安装情况,打开代码试运行。

2. 课前检查电脑、投影仪、网络是否有故障,及时修复。

3. 备课过程中预设上课的突发情况,想办法解决。

4. 备课过程中,以学生的视角去审视自己的课堂,及时做出改进。

5. 课前排查教学环境中所存在的安全隐患。

五、教学活动

1情景引入(时间:5-10min)

1.1同学们,之前的课程中我们学习了一些前端(也就是做网页)的知识,相信同学们已经初步具备了网页页面的制作技术啦!但是在这个阶段Python的学习任务中,网页制作并非是我们学习的重点哦!毕竟Python是属于后端的编程语言,和网页的制作并非有太多的直接关系哟!可是没有关系我们还为什么要学习4节课的网页制作课程呢?那是为了铺垫我们后面的学习,本阶段我们主要的学习任务是爬虫(数据采集),它呢是Python众多应用领域中非常著名的一节,也是Python强大功能的体现,那么具体什么是爬虫呢?快来跟着老师一起认识一下吧!

2.2如今,人工智能,大数据离我们越来越近,很多公司在开展相关的业务,但是人工智能和大数据中有一个东西非常重要,那就是数据,但是数据从哪里来呢?同学们都有思考过吗?【学生提问】下面老师准备了一个微博指数的截图,同学们可以看到这其中根据数据所制作出来的分析图。把在微博上用户评论中的关键词语做了提取,然后进行了统计,然后根据统计结果得出某个词语的流行趋势,之后进行了简单的展示。类似微指数的网站还有很多,比如百度指数,阿里指数,360指数等等,这些网站有非常大的用户量,他们能够获取自己用户的数据进行统计和分析。那么对于一些中小型的公司,没有如此大的用户量的时候,他们该怎么办呢?

2什么是爬虫(时间:15-20min)

3.1在爬虫没有出来之前,我们都采用最简单直接的方法就是人工收集数据,比如问卷调查等等,人工的方法费时费力,效率还是极低很容易发生统计错误的情况;为了提高效率相应地出现了一些第三方主要做数据的公司,我们可以直接去他们那里购买相应所需要的数据;再后来互联网出现了,我们可以免费的去一些网站上下载数据,比如国家统计局这些政府的服务网站;再后来爬虫技术出现了,我们可以通过爬虫去进行数据的爬取,大大提高了工作效率,也降低了成本。

3.2再比如百度并不是一下做新闻的公司,但是在百度的网站上我们可以看到各种各样的新闻信息,那么他们这些新闻的数据信息都是从哪里来的呢?当然是从别人家的网站上拿过来的!当我们点击这些新闻链接的时候,我们会发现,浏览器的页面会自动跳转到别人家的网站里面,这就是爬虫技术的体现。爬虫一般获取到的信息有两种用途,一是进行网页或者APP上的展示;二是进行数据分析或者机器学习相关的项目。

3.3说了这么多,同学们现在对于爬虫是不是已经有了一定的了解呢?网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。原则上,只要是浏览器(客户端)能做的事情,爬虫都可以做!比如12306的抢票,携带用户信息不停地向服务器发送购票请求;网站投票,模拟不同的用户不停地进行点击投票;还就是很不道德短信轰炸,利用互联网短信不停地发送信息等等

4爬虫的分类和流程(时间:20-25min)

4.1爬虫的分类方式比较特别,它是按照被爬取的网站数量的不同进行分类的!一般我们把爬取网站数量多的爬虫成为通用爬虫,通常指搜索引擎爬虫;爬取网站数量少的成为聚焦爬虫,指针对特定网站的爬虫。

4.2搜索引擎爬虫用于自动抓取网页信息,当我们在使用浏览器中的搜索引擎进行检索的时候,浏览器就会自动根据输入的信息在

文档评论(0)

1亿VIP精品文档

相关文档