- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
手把手教你使用Python抓取QQ音乐数据(第一弹)
IT共享者 Python爬虫与数据挖掘
2021-03-31
点击上方“IT共享之家”,进行关注
回复“材料”可获赠Python学习福利
【一、项目目标】
????猎取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名、专辑名、播放链接。
????由浅入深,层层递进,格外适合刚入门的同学练手。
【二、需要的库】
????次要涉及的库有:requests、json、openpyxl
【三、项目实现】
1.了解 QQ 音乐网站的 robots 协议
只禁止播放列表,可以操作。
2.进入 QQ 音乐主页 /
3.输入任意歌手,比如邓紫棋
4.打开审查元素(快捷键 Ctrl+Shift+I)
5.分析网页源代码 Elements,发觉无歌曲信息,无法使用 BeautifulSoup,如下图所示,结果为空。
6.点击 Network,看数据在不在 XHR(无刷新更新页
面),我的阅历是先看 Size 最大的,然后分析 Name,
查看 Preview,果真在里面!
7.点击 Headers,拿到相关参数。如下图,认真观看
url 与 Query String Parameters 参数的关系,发觉
url 中的 w 代表歌手名,p 代表页数。
8.通过 json 代码实现,首先小试牛刀,爬取第一页
的数据,url 直接复制过来。成功!
9.引入 params 参数,实现指定歌手、指定页数的查询。
留意代码url为上一步url中“?”之前的部分, params两边的参数都需要加 ’’,requests.get 添加 params,参数(也可顺便添加 headers 参数)
10. 添加存储功能,保存到本地(Excel)。也可保存为 csv 格式或存入数据库,操作类似。
【四、总结】
1.爬取 QQ 音乐比爬取豆瓣等网站稍难,所需信息不在网页源代码,需查看 XHR;
2.通过 XHR 爬取数据一般要使用 json,格式为:
res = requests.get(url)
json = res.json()
list = json[‘’][‘’]…
3.仅供练手参考,不建议爬取太多数据,给服务器增大负载;
4.Python 爬取 QQ 音乐数据(二)将为大家带来如何爬取指定歌曲的歌词及评论(selenium),并生成词云图(wordcloud),敬请期盼。
5.需要本文源码的话,请在后台回复“QQ音乐”四个字进行猎取。
看完本文有收获?请转发共享给更多的人
IT共享之家
入群请在微信后台回复【入群】
精选留言
用户设置不下载评论
阅读全文
您可能关注的文档
- 个人入党证明怎么写范文大全.docx
- 大数据性能调优之HBase的RowKey设计.docx
- 大数据平台的技术演化之路 诸葛io平台设计实例.docx
- 个人入党自传范文150字.docx
- 大数据推荐系统实时架构和离线架构.docx
- 大数据时代秒级查询响应引擎的架构设计.docx
- 大牛十年工作经验总结,值得学习.docx
- 大规模的可观察性:构建Uber的预警生态系统.docx
- 天天写「业务代码」,如何成为「技术大牛」?.docx
- 太牛逼了!用 Python 实现抖音上的“人像动漫化”特效,原来这么简单!.docx
- 手把手教你使用Python抓取QQ音乐数据(第二弹).docx
- 手把手教你使用Python抓取QQ音乐数据(第三弹).docx
- 手把手教你使用Python生成图灵智能小伙伴,实现工作助手闲聊功能.docx
- 手把手教你使用Python网络爬虫实现邮件定时发送(附源码).docx
- 个人商务合作协议范本.docx
- 手把手教你使用Python网络爬虫获取B站视频选集内容(附源码).docx
- 手把手教你使用Python获取B站视频并在本地实现弹幕播放功能.docx
- 手把手教你使用Python轻松打造淘宝主图视频生成神器.docx
- 手把手教你使用Python轻松搞定发邮件.docx
- 手把手教你使用scrapy框架来爬取北京新发地价格行情(理论篇).docx
文档评论(0)