Python数据可视化(微课版).pptx

  1. 1、本文档共236页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Python数据可视化分析

与案例实战;本书目录;第1章数据可视化概述;1;数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。

在数据分析中,我们会接触到很多的数据,而这些数据都是有类别之分的,根据结构的不同,数据可以分为三种:结构化数据、非结构化数据、半结构化数据。

通常,数据分析工作正常开展的前提,是要有数据,一般情况下,数据的来源主要有三种。

1.企业系统数据

2.本地离线数据

3.外部公开数据

;数据预处理一般包含数据清洗、数据集成、数据转换和数据消减4个阶段:

;可视化被定义为利用计算机图形学和图像处理技术,将数据转换成图形或图像,并在屏幕上显示出来。

在大数据时代,数据可视化工具必须具备以下4个特性:数据实时更新、软件易于操作、展现形式丰富、多种数据集成。

围绕大数据的4种特性,未来数据可视化的挑战主要有以下两个方面:

1.大数据可视化分析

2.探索式可视化分析

;1;数据可视化应该以业务场景为起始点,以业务决策为终点。基于数据分析师的工作职责,我们总结了数据可视化的5个步骤:

;设计数据可视化时,需要遵循以下8个方面的原则:

;为可视化设计或选择交互的时候,除了需要符合数据类别和所要完成的任务外,还要遵守一些普遍的准则,交互技术的类型形形色色,下面介绍7种常用的交互方法。

;1;对比型图表一般是比较几组数据的差异,这些差异通过视觉和标记来区分,体现在视图中通常表现为高度差异、宽度差异、面积差异等,包括柱形图、条形图、气泡图、雷达图等。

1.柱状图:描述的是分类数据的数值大小,回答的是每一个分类中“有多少”的问题。需要注意的是,当柱状图显示的分类很多时,会导致分类重叠等显示问题。

2.条形图:显示各项目之间的比较情况,分为垂直条形图和水平条形图,其中水平条形图纵轴表示分类,横轴表示数值。他强调各个值之间的比较,不太关注时间的变化。

3.气泡图:是散点图的变体,气泡的大小表示数据维,通常用于比较和展示不同类别之间的关系。

4.雷达图:当我们拥有一组类别型数据、一组连续数值型数据时,为了对比数据大小情况,我们就可以使用雷达图。;趋势型图表用来反映数据随时间变化而变化的趋势,尤其是在整体趋势比单个数据点更重要的场景下,包括折线图、面积图、曲面图等。

1.折线图:用于显示数据在一个连续的时间间隔或者跨度上的变化,它的特点是反映事物随时间或有序类别而变化的趋势。

2.面积图:是折线图的另一种表现形式,其一般用于显示不同数据系列之间的对比关系,同时也显示单个数据系列与整体的比例关系,强调随时间变化的幅度。

3.曲面图:可以在曲面上显示两个或多个数据系列,实际上它是折线图和面积图的另一种形式,我们可以通过创建曲面图来实现两组数据之间的最佳配合。

;比例型图表用于展示每一部分占整体的百分比情况,至少有一个分类变量和数值变量,包括饼图、环形图、旭日图等。

1.饼图:通过将一个圆饼按照分类的占比划分成若干个区块,整个圆饼代表数据的总量,每个圆弧表示各个分类的比例大小,所有区块的和等于100%。

2.环形图:是一类特殊的饼图,它是由两个及两个以上大小不一的饼图叠加在一起,然后挖去中间的部分所构成的图形。

3.旭日图:由多层的环形图组成,在数据结构上,内圈是外圈的父节点。因此,它既可以像饼图一样表现局部和整体的占比,又能像树图一样表现层级关系。;分布型图表用于研究数据的集中趋势、离散程度等描述性度量,用以反映数据的分布特征,包括散点图、直方图、箱型图等。

1.散点图:将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。

2.直方图:是由一系列高度不等的柱状条块表示数据分布的情况,柱与柱之间基本没有间隔,有间隔就是柱状图,一般用横轴表示数据类型,纵轴表示分布情况。

3.箱型图:又称盒须图,它是一种显示一组数据分散情况的统计图,能显示数据的最大值、最小值、中位数、及上下四分位数,因形状如箱子而得名。;除了以上四种类型的基本图表外,还有一些其它类型的图表,它们在日常可视化分析过程中也会经常遇到,主要包括树状图、瀑布图、股价图等。

1.树状图:在嵌套的矩形中显示数据,使用分类变量定义树状图的结构,使用数值变量定义各个矩形的大小或颜色。

2.瀑布图:形似瀑布流水,采用绝对值与相对值结合的方式,适用于表达多个特定数值之间的数量变化关系,当需要表达两个数据点之间数量的演变过程时,就可以使用瀑布图。

3.股价图:用来显示股票价格的波动情况,在研究金融数据时经常被用到,一般包括股票的开盘价、盘高价、盘低价、收盘价等信息。;;第2章Python数据可视化库;目录;5;Matplotlib是比较基础的Python绘图库,它是基于NumP

文档评论(0)

139****1983 + 关注
实名认证
内容提供者

副教授、一级建造师持证人

一线教师。

领域认证该用户于2023年06月21日上传了副教授、一级建造师

1亿VIP精品文档

相关文档