手把手教你使用Python抓取QQ音乐数据(第一弹).docxVIP

手把手教你使用Python抓取QQ音乐数据(第一弹).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
手把手教你使用Python抓取QQ音乐数据(第一弹) IT共享者 Python爬虫与数据挖掘 2021-03-31 点击上方“IT共享之家”,进行关注 回复“材料”可获赠Python学习福利 【一、项目目标】 ????猎取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名、专辑名、播放链接。 ????由浅入深,层层递进,格外适合刚入门的同学练手。 【二、需要的库】 ????次要涉及的库有:requests、json、openpyxl 【三、项目实现】 1.了解 QQ 音乐网站的 robots 协议 只禁止播放列表,可以操作。 2.进入 QQ 音乐主页 / 3.输入任意歌手,比如邓紫棋 4.打开审查元素(快捷键 Ctrl+Shift+I) 5.分析网页源代码 Elements,发觉无歌曲信息,无法使用 BeautifulSoup,如下图所示,结果为空。 6.点击 Network,看数据在不在 XHR(无刷新更新页 面),我的阅历是先看 Size 最大的,然后分析 Name, 查看 Preview,果真在里面! 7.点击 Headers,拿到相关参数。如下图,认真观看 url 与 Query String Parameters 参数的关系,发觉 url 中的 w 代表歌手名,p 代表页数。 8.通过 json 代码实现,首先小试牛刀,爬取第一页 的数据,url 直接复制过来。成功! 9.引入 params 参数,实现指定歌手、指定页数的查询。 留意代码url为上一步url中“?”之前的部分, params两边的参数都需要加 ’’,requests.get 添加 params,参数(也可顺便添加 headers 参数) 10. 添加存储功能,保存到本地(Excel)。也可保存为 csv 格式或存入数据库,操作类似。 【四、总结】 1.爬取 QQ 音乐比爬取豆瓣等网站稍难,所需信息不在网页源代码,需查看 XHR; 2.通过 XHR 爬取数据一般要使用 json,格式为: res = requests.get(url) json = res.json() list = json[‘’][‘’]… 3.仅供练手参考,不建议爬取太多数据,给服务器增大负载; 4.Python 爬取 QQ 音乐数据(二)将为大家带来如何爬取指定歌曲的歌词及评论(selenium),并生成词云图(wordcloud),敬请期盼。 5.需要本文源码的话,请在后台回复“QQ音乐”四个字进行猎取。 看完本文有收获?请转发共享给更多的人 IT共享之家 入群请在微信后台回复【入群】 精选留言 用户设置不下载评论 阅读全文

文档评论(0)

liuxiyuliuxingyu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档