12_数据分布的可视化 .pdfVIP

  • 2
  • 0
  • 约小于1千字
  • 约 10页
  • 2020-11-23 发布于广东
  • 举报
数据可视化 数据分布的可视化 单元目标 l 了解可视化数据分布的方法 l 能够根据数据情况选择合适的方法展现数据的分布 l 完成部分数据分布的可视化图表 数据分布 数据的分布 我们对一组数据的峰值 ,谷值 ,数据范围以及数据的分布情况需要进行了解 , 包括平均数 ,中位数等概要信息 ,能帮助我们快速了解一组数据的基本情况 , 对原始数据和概要统计之间对照 ,更有助于我们发现问题。 一维数据的分布 例子 :一个房间里有100个成年人 ,身高各不相同。对原始数据进行排序 ,可以迅速确定 最高和最矮的身高的人 ,通过中位数可以知道50个人高于此身高 ,50个人低于此身高。 一维数据的分布 例子 :但是如果想知道那个身高段的人最多 ,可以按照身高进行分类 ,如左图的散点图。 更方便的方法是有右边的柱状图 ,也就是直方图。能够了解数据的分布情况。 一维数据的分布 可以用不同的粒度可视化数据分布 一维数据的分布 箱形图 通过一组连续数值的最大值 ,最 小值 ,上四分位 ,下四分位 ,中 位线这四个元数据进行绘制 ,映 射到Y轴 ,可以快速了解数据的分 布和异常值。 一维数据的分布 鸢尾花数据为例 ,可以看出不同 品种 ,相同属性的数值之间的区 别 一维数据的分布 小提琴图 通过箱形图和密度图组合 ,既展 示了分位数的位置 ,有可以展示 任意位置的密度。也可以多个小 提琴图放到一起比较。 一维数据的分布 鸢尾花的萼片长度数据 ,箱形图和小提琴图的对比。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档