- 1
- 0
- 约3.57千字
- 约 6页
- 2026-03-12 发布于广西
- 举报
PAGE
PAGE1
实战:网易音乐
——第18次课常规课
一、教学目标
1.知识与技能
(1)学习自主分析网站页面结构,设计爬虫代码思路;
(2)编写代码,完成抓取数据的任务。
2.过程与方法:
(1)通过一个个贴近生活的案例进行情景引入,激发学生对本节学习内容的兴趣,引发关联性的内容思考;
(2)每节课程开始前,对上节学习内容的知识点进行复习,加深印象;
(3)老师与学生间进行代码互动式的教学编写,带着孩子一步步完成任务。
3、情感态度与价值观:
(1)通过贴近生活的案例培养激发孩子的兴趣与爱好,在一个个生活案例中树立孩子正确的价值导向;
(2)代码的编写过程是精彩的,也是乏味的;是充满创造性的,也是一点点的基础前行;训练孩子逻辑思维、想象能力的同时,还磨练了孩子们的耐心,做到身心的锻炼。
二、教学重点、难点
【重点】编写爬虫代码
【难点】网站链接陷阱以及网页源码解析
三、课时安排
课时安排:120分钟
四、上课准备
1. 课前检查所有学员电脑Python的安装情况,打开代码试运行。
2. 课前检查电脑、投影仪、网络是否有故障,及时修复。
3. 备课过程中预设上课的突发情况,想办法解决。
4. 备课过程中,以学生的视角去审视自己的课堂,及时做出改进。
5. 课前排查教学环境中所存在的安全隐患。
五、教学活动
1情境引入(时间:5-10min)
1.1在上节课,我们练习使用爬虫代码爬取了大量的短文学网站的诗歌散文,不知道同学们回去之后都有看过这些散文诗吗?爬虫代码是不在不断地练习中进步的,不同网站有着不同的网页结构,正是因为这些网页形式的不同,才让我们的在编写爬虫代码的时候充满了未知的挑战与乐趣。
1.2今天呢,我们继续爬虫代码的实战练习,本节课呢,我们要爬取的内容同样也是可以陶冶情操,培养意境的优秀内容,不知道同学们猜出来了吗?没错,就是音乐!今天我们挑选的就是网易云音乐的web网站,相对客户端浏览器的爬虫更容易编写,感兴趣的同学课后也可以上网去找查些资料,看看客户端的爬虫代码是如何编写的!
2网站页面分析(时间:20-25min)
2.1首先第一步,爬虫的开始我们要先对我们爬取的目标网站进行结构分析。先打开谷歌浏览器,输入短文学网站的网址/#,来到网站首页,我们可以发现,音乐网站平台中的音乐大都是以歌单的形式存现,如果我们单独去爬取歌曲会比较麻烦,所以我们可以从歌单入手,按歌单列表来进行爬取数据。当然,本节课呢,我们不爬歌单,我们爬取它的音乐排行榜!既然爬取排行榜,当然需要先点击栏目来到他的排行榜页面,我们以云音乐热歌榜为例进行本节课的爬虫代码编写。
2.2观察云音乐热歌榜下翻到浏览器的底部我们可以发现,该榜单总共只有200首歌,并且不像我们爬取诗歌散文时涉及网页翻页,它全部都在一个网页页面中,所以我们访问的时候只需要获取到主页的信息即可!在网页代码中,我们可以查看到歌曲的链接地址(需要拼接)以及歌曲的名字,那么思考,我们如何下载歌曲呢?老师为同学们准备了一个下载链接,仅需要拼接上歌曲的id号,即可直接访问到下载的响应。而歌曲的id号,在网页的源代码数据中我们就可以提取出来!同学们现在可以尝试一下,找一个歌曲的id试着拼接上/song/media/outer/url?id={}的网址链接,访问观察结果!
importrequests
fromlxmlimportetree
classMusicSpider(object):
def__init__(self):
#热歌榜歌单链接
self.base_url=/discover/toplist?id=3778678
#歌曲资源下载链接
self.source_rul=/song/media/outer/url?id=
self.headers={User-Agent:Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/63.0.3239.132Safari/537.36QIHU360SE}
#请求网易云热歌榜歌单
defget_response(self,url):
data=requests.get(url,headers=self.headers).content.decode()
returndata
#提取热歌榜网页中的每一栏歌曲信息
defanalysis_data(self,data):
原创力文档

文档评论(0)