- 0
- 0
- 约4.36千字
- 约 7页
- 2026-03-12 发布于广西
- 举报
PAGE
PAGE1
认识爬虫
——第5次课常规课
一、教学目标
1.知识与技能
(1)具备爬虫的基本概念;
(2)了解爬虫的种类以及工作流程;
(3)复习http和https的相关知识以及字符串的编解码方式。
2.过程与方法:
(1)通过一个个贴近生活的案例进行情景引入,激发学生对本节学习内容的兴趣,引发关联性的内容思考;
(2)每节课程开始前,对上节学习内容的知识点进行复习,加深印象;
(3)老师与学生间进行代码互动式的教学编写,带着孩子一步步完成任务。
3、情感态度与价值观:
(1)通过贴近生活的案例培养激发孩子的兴趣与爱好,在一个个生活案例中树立孩子正确的价值导向;
(2)代码的编写过程是精彩的,也是乏味的;是充满创造性的,也是一点点的基础前行;训练孩子逻辑思维、想象能力的同时,还磨练了孩子们的耐心,做到身心的锻炼。
二、教学重点、难点
【重点】爬虫的工作流程
【难点】http与https的区别;字符串的编解码转换
课时安排
课时安排:120分钟
四、上课准备
1. 课前检查所有学员电脑Python的安装情况,打开代码试运行。
2. 课前检查电脑、投影仪、网络是否有故障,及时修复。
3. 备课过程中预设上课的突发情况,想办法解决。
4. 备课过程中,以学生的视角去审视自己的课堂,及时做出改进。
5. 课前排查教学环境中所存在的安全隐患。
五、教学活动
1情景引入(时间:5-10min)
1.1同学们,之前的课程中我们学习了一些前端(也就是做网页)的知识,相信同学们已经初步具备了网页页面的制作技术啦!但是在这个阶段Python的学习任务中,网页制作并非是我们学习的重点哦!毕竟Python是属于后端的编程语言,和网页的制作并非有太多的直接关系哟!可是没有关系我们还为什么要学习4节课的网页制作课程呢?那是为了铺垫我们后面的学习,本阶段我们主要的学习任务是爬虫(数据采集),它呢是Python众多应用领域中非常著名的一节,也是Python强大功能的体现,那么具体什么是爬虫呢?快来跟着老师一起认识一下吧!
2.2如今,人工智能,大数据离我们越来越近,很多公司在开展相关的业务,但是人工智能和大数据中有一个东西非常重要,那就是数据,但是数据从哪里来呢?同学们都有思考过吗?【学生提问】下面老师准备了一个微博指数的截图,同学们可以看到这其中根据数据所制作出来的分析图。把在微博上用户评论中的关键词语做了提取,然后进行了统计,然后根据统计结果得出某个词语的流行趋势,之后进行了简单的展示。类似微指数的网站还有很多,比如百度指数,阿里指数,360指数等等,这些网站有非常大的用户量,他们能够获取自己用户的数据进行统计和分析。那么对于一些中小型的公司,没有如此大的用户量的时候,他们该怎么办呢?
2什么是爬虫(时间:15-20min)
3.1在爬虫没有出来之前,我们都采用最简单直接的方法就是人工收集数据,比如问卷调查等等,人工的方法费时费力,效率还是极低很容易发生统计错误的情况;为了提高效率相应地出现了一些第三方主要做数据的公司,我们可以直接去他们那里购买相应所需要的数据;再后来互联网出现了,我们可以免费的去一些网站上下载数据,比如国家统计局这些政府的服务网站;再后来爬虫技术出现了,我们可以通过爬虫去进行数据的爬取,大大提高了工作效率,也降低了成本。
3.2再比如百度并不是一下做新闻的公司,但是在百度的网站上我们可以看到各种各样的新闻信息,那么他们这些新闻的数据信息都是从哪里来的呢?当然是从别人家的网站上拿过来的!当我们点击这些新闻链接的时候,我们会发现,浏览器的页面会自动跳转到别人家的网站里面,这就是爬虫技术的体现。爬虫一般获取到的信息有两种用途,一是进行网页或者APP上的展示;二是进行数据分析或者机器学习相关的项目。
3.3说了这么多,同学们现在对于爬虫是不是已经有了一定的了解呢?网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。原则上,只要是浏览器(客户端)能做的事情,爬虫都可以做!比如12306的抢票,携带用户信息不停地向服务器发送购票请求;网站投票,模拟不同的用户不停地进行点击投票;还就是很不道德短信轰炸,利用互联网短信不停地发送信息等等
4爬虫的分类和流程(时间:20-25min)
4.1爬虫的分类方式比较特别,它是按照被爬取的网站数量的不同进行分类的!一般我们把爬取网站数量多的爬虫成为通用爬虫,通常指搜索引擎爬虫;爬取网站数量少的成为聚焦爬虫,指针对特定网站的爬虫。
4.2搜索引擎爬虫用于自动抓取网页信息,当我们在使用浏览器中的搜索引擎进行检索的时候,浏览器就会自动根据输入的信息在
您可能关注的文档
- python课件教案03-教案.docx
- python课件教案04-教案.docx
- python课件教案05-教案.docx
- python课件教案06_函数拓展.pptx
- python课件教案06-教案.docx
- python课件教案07-教案.docx
- python课件教案10-教案.docx
- python课件教案11-教案.docx
- python课件教案12-教案.docx
- python课件教案13-教案.docx
- 【银河专题】如何看待豆粕内外价差关系.pdf
- 工业5.0指数:国家如何重塑2025年的经济进步.docx
- 【蔚云科技】亚马逊【扫地机器人】行业消费者洞察报告.docx
- 青海大通县朔山中学2025-2026学年高三下学期开学考试政治+答案.docx
- 青海大通县朔山中学2025-2026学年高三下学期开学考试英语+答案.docx
- 东北师大附中2025届高三下学期期初考试-英语试题+答案.pdf
- 广东省汕头市2024-2025学年高三下学期第一次模拟考试政治试题(含答案).docx
- KPMG -欧洲数字产品护照 European Digital Product Passport.pdf
- 腾讯安全沙龙:后渗透新维度:利用Chrome插件后门实现持久化与凭据窃听.pdf
- 可持续发展报告调查:2025年结果.docx
原创力文档

文档评论(0)