【黑马程序员】爬虫教程、爬虫Python、解析Python网络爬虫：核心技术、Scrapy框架、分布式爬虫.pdf

下载文档

851
0
约6.86千字
约 13页
2021-07-19 发布于湖北
举报
版权申诉
保障服务

该文档出现过质量纠纷，请谨慎下载 纠纷原因：内容不全 备注：如您继续下载，则代表你接受本文档瑕疵，并放弃退款

【黑马程序员】爬虫教程、爬虫Python、解析Python网络爬虫：核心技术、Scrapy框架、分布式爬虫.pdf

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

【黑马程序员】爬虫教程、爬虫 Python 、解析 Python 网络爬虫：核心技术、 Scrapy 框架、分布式爬虫内容简介：本书适合网络爬虫方向的初学者，系统全面地讲解了如何使用 Python 快速编写网络爬虫程序。本书在讲解时，结合理论加实践，循序渐进地引领读者疏通原理、动手实践、运用框架。通过本书可以让读者快速进入爬虫领域，具备运用爬虫的能力，满足获取定制数据的需求。全书共分为 13 个章节，内容主要包括初识网络爬虫、爬虫的实现原理和技术、网页请求的原理、抓取和解析网页数据的相关技术、并发下载，抓取动态网页、图像识别与文字处理、存储爬虫数据，以及爬虫框架 Scrapy 的使用，最后介绍了通过 Scrapy-Redis 如何实现分布式爬虫。视频库网址：资料领取： 3285264708 适合群体：本书既可作为高等院校专科计算机相关专业的程序设计课程教材，也可作为 Python 网络爬虫的培训教材，是一本适合广大编程开发者的爬虫入门级教材。图书特色：特色一：零基础、入门级讲解为了帮助读者快速入门，本书以初学者的角度出发，铺垫讲解了很多关于网络爬虫的基础知识，让读者站在原理的角度上理解爬虫的机制。特色二：循序渐进，通俗易懂在课程知识和内容讲解上，本书所涉及到的知识点都是对应实际应用需求，课程的编排顺序符合大众的认知规律，在知识讲解时采用易于理解的图示和举例的方式，将抽象的概念具体化，并利用示例进一步验证和测试，以总结出实用的经验。特色三：案例丰富、实战性强全书共 13 章，除了第 1 章介绍爬虫基础知识外，其余每章配有一个真实的爬虫案例，具有极高的参考价值。读者只要亲自实践本书中的案例，轻松掌握爬虫，那都不是事儿 ~ 特色四：知识点全面，技巧性强在学习爬虫的过程中，本书都会在解决爬虫问题的基础上，提供多种技术参考和解决方案，并且对这些方案进行对比，以供读者在实际运用中更好地选择，增强读者在工作中的编程能力。特色五：教材、资源、服务三合一，高效学习视频库网址：资料领取： 3285264708 为了便于老师备课，本教材配备了精美的 PPT、教学视频和源代码等资源。本书还有配套题库可以根据需求自由组卷，方便老师考察学生的学习情况。图书目录：第 1 章初识爬虫 1.1 爬虫产生背景 1.2 什么是爬虫 1.3 爬虫的用途 1.4 爬虫的分类 1.4.1 通用爬虫和聚焦爬虫 1.4.2 累积式和增量式爬虫 1.4.3 表层爬虫和深层爬虫 1.5 本章小结 1.6 本章习题第 2 章爬虫的实现原理和技术 2.1 爬虫实现原理简介 2.1.1 通用爬虫工作原理 2.1.2 聚焦爬虫工作原理 2.2 爬虫抓取网页的详细流程 2.3 通用爬虫中网页的分类 2.4 通用爬虫相关网站文件 2.4.1 robots.txt 文件视频库网址：资料领取： 3285264708 2.4.2 Sitemap.xml 文件 2.5 反爬虫应对策略 2.6 为什么选择 Python 做爬虫 2.7 案例—使用八爪鱼工具爬取第一个网页 2.8 本章小结 2.9 本章习题第 3 章网页请求原理 3.1 浏览网页过程 3.1.1 统一资源定位符 U