- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《Python 3爬虫、数据清洗与可视化实战》共分11 章,6 个核心主题:其一是Python 基础入 ,包括环境配
置、基本操作、数据类型、语句和函数;其二是Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码
优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python 数据库应用,包括
MongoDB、MySQL 在Python中的连接与应用;其四是数据清洗和组织,包括NumPy 数组知识、pandas 数据
的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者
贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib 和Pyecharts 两个库的使用,涉及饼
图、柱形图、线图、
词云图、地图等图形,帮助读者进入可视化的殿堂。
《Python 3爬虫、数据清洗与可视化实战》以实战为主,适合Python 初学者及高等院校的相关专业学生,也适
合Python 培训机构作为实验教材使用。
作作者者简简介介
零一
沐垚科技创始人,电商自媒体,资深数据分析师,8年电商从业经验,擅长 xcel、Power BI、R、Python等工
具,主要研究数据化运营、商业智能和人工智能在电商领域的应用,专注数据+ 电商的新零售服务。 出版 《电商
数据分析淘宝实战》 《美丽的电商运营日记》 《xcel BI 之道:从零开始学Power工具应用》 《淘宝、天猫电商
数据分析与挖掘实战》
加python学习qq群:775690737 送python零基础入 学习资料+99个源码
目目录录
第1 章 Python 基础 1
1.1 安装Python 环境 1
1.1.1 Python 3.6.2 安装与配置 1
1.1.2 使用ID 工具——PyCharm 4
1.1.3 使用ID 工具——Anaconda 4
1.2 Python 操作入 6
1.2.1 编写第一个Python 代码 6
1.2.2 Python 基本操作 9
1.2.3 变量 10
1.3 Python 数据类型 10
1.3.1 数字 10
1.3.2 字符串 11
1.3.3 列表 13
1.3.4 元组 14
1.3.5 集合 15
1.3.6 字典 15
1.4 Python 语句与函数 16
1.4.1 条件语句 16
1.4.2 循环语句 16
1.4.3 函数 17
第2 章 写一个简单的爬虫 18
2.1 关于爬虫的合法性 18
2.2 了解网页 20
2.2.1 认识网页结构 21
2.2.2 写一个简单的HTML 21
2.3 使用requests 库请求网站 23
2.3.1 安装requests 库 23
2.3.2 爬虫的基本原理 25
2.3.3 使用G T 方式抓取数据 26
2.3.4 使用POST 方式抓取数据 27
2.4 使用Beautiful Soup 解析网页 30
2.5 清洗和组织数据 34
2.6 爬虫攻防战 35
第3 章 用API 爬取天气预报数据 38
3.1 注册免费API 和阅读技术文档 38
3.2 获取API 数据 40
3.3 存储数据到MongoDB 45
3.3.1 下载并安装MongoDB 45
3.3.2 在PyCharm 中安装Mongo Plugin 46
3.3.3 将数据存入MongoDB 49
3.4 MongoDB 数据库查询 52
第4 章 大型爬虫案例:抓取某电商网站的商品数据 55
4.1 观察页面特征和解析数据 55
4.2 工作流程分析 64
4.3 构建类目树 65
4.4 获取产品列表 68
4.5 代码优化 70
4.6 爬虫效率优化 74
4.7 容错处理 77
第5 章 Scrapy 爬虫 78
5.1 Scrapy 简介 78
5.2 Scrapy 安装 79
5.3 案例:用Scrapy 抓取股票行情 80
第6 章 Selenium爬虫 88
6.1 Selenium 简介 88
6.2 案例:用Selenium 抓取电商网站数据 90
第7 章 数据库连接和查询 100
7.1 使用PyMySQL 100
7.1.1 连接数据库 100
7.1.2 案例:某电商网站女装行业TOP100 销量数据 102
7.2 使用SQLAlchemy 104
7.2.1 SQLAlchemy 基本介绍 104
7.2.2 SQLAlchemy
您可能关注的文档
- 在Power BI Desktop中使用Python导入数据.pdf
- 有了PowerQuery还需要SSIS吗.pdf
- 玩转Spring JUnit+mockito+powermock单元测试(使用详解).pdf
- 使用TabularEditor进行PowerBIDeskTop模型开发最佳实践.pdf
- 使用Power BI 和Power BI webpart生成SharePoint List的报表.pdf
- 使用Power BI Desktop连接到SQL Server和Facebook.pdf
- 使用DAX查询从PowerbiDeskTop中获取数据源.pdf
- 商业银行项目建议书范本.pdf
- 企业数据管理普遍混乱,揭秘大数据分析趋势以及PowerBI的崛起机遇....pdf
- 利用DAX Studio连接PowerBI数据集到Excel并实现数据刷新.pdf
- PowerBI技巧之ppc64le处理器国产power8服务器CentOS7.2安装ibm-jdk.pdf
- PowerBI技巧之PowerQuery与PowerPivot将引爆你的桌面级数据分析:能量巨大,超出你想象!.pdf
- PowerBI技巧之PowerQuery与M语言之什么是PowerQuery和M语言!-PowerQuery系列文章之一.pdf
- PowerBI技巧之PowerQuery的数据获取界面(Excel及PowerBI)的异同.pdf
- PowerBI技巧之PowerQuery 实现数据导入CSV 功能-PowerQuery 系列文章之四.pdf
- PowerBI技巧之PowerQuery 导入Excel 内容-PowerQuery 系列文章之五.pdf
- PowerBI技巧之PowerBuilder中quick select类型的datawinow数据源控件中添加查询参数.pdf
- PowerBI技巧之PowerBI实用技巧:案例五(巧用Switch函数展现指标RGB颜色).pdf
- PowerBI技巧之PowerBI实用技巧:案例三(动态参数筛选控制排名的展示——DAX RANKX).pdf
- PowerBI技巧之PowerBI-日期和时间函数-YEAR_QUARTER_MONTH_DAY.pdf
最近下载
- 甲骨文与青铜器课件.ppt VIP
- 《2025年CSCO宫颈癌诊疗指南》更新要点解读PPT课件.pptx VIP
- 《分数乘除混合运算》示范公开课教学设计【青岛版小学六年级数学上册】.pdf VIP
- 部编版11.一块奶酪 教学设计教案 三年级语文上册(带板书设计、教学反思)3.docx VIP
- 静脉采血技术操作规范2025版.docx VIP
- 最全的日语汽车词汇汇总.docx VIP
- 护理组织管理体系与职责分工..doc VIP
- 2025食品生产通用卫生规范年GB14881试题及参考答案.docx VIP
- 屈光手术科普知识.pptx VIP
- 2025年高考数学全国新课标Ⅰ卷试卷评析及备考策略(课件).pptx VIP
文档评论(0)