- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
有关关系的可视化
在关系中寻求什么关联性(圆点、探索更多的变量、气泡)分布(老式分布图表、有关分布的柱形、延续性的密度)对照和比较4.本章主要内容1.2.3.
D当某个数量增加时,另一个数量是否会减少?它们之间是因果关系还是关联关系?群体彼此之间是存在交叠还是互不干涉?D关联性可以帮助我们根据某一已知指标来预测另一指标。7.1在关系中寻求什么
7.2关联性——散点图(探索更多的变量)图.散点图矩阵的基本框架
优势在于一次比较3个变量:Dx轴Dy轴D气泡的面积7.2关联性—气泡图图.气泡图的基本框架
直方图Hist()用一系列宽度相等、高度不等的长方形来表示数据分布7.3分布
matplotlib.pyplot.hist(x,bins,range,density,weights,cumulative,bottom,histtype,**kwargs)参数说明(部分):Dx→作图所用的数据,一维数组,多维数组可以扁平化后再作图Dbins→直方图的柱数,可选项,整数、序列或字符串型。默认10Drange→指定直方图数据的上下界,默认包含绘图数据的最大值和最小值(范围)Ddensity→布尔值,如果为True”,将y轴转化为密度刻度,默认为NoneDweights→为每个数据点设置权重Dcumulative→布尔值,是否需要计算累计频数或频率,默认为FalseDbottom→为直方图添加基准线,数组型,默认为noneDhisttype→直方图类型,分为bar,barstacked,step,stepfilled。默认为bar
主要用于反映原始数据分布的特征,也可以进行多组数据分布特征的比较。盒须图(箱形图Range又称为分位差。内距IQRInter-Quartile,四
盒须图变种可以水平或者垂直绘制
盒须图变种2DBoxPlotRelplotRangefinderBoxPlotBagPlot
值,默认值为False。可选参数。Dsym:离群点的默认标记符号,详解flierprops参数。类型为字符串,默认值为None。可选参数。取值为隐藏离群点,取值为None时,取值为b+’。Dvert:箱体的方向,当取值为True时,绘制垂直箱体,当取值为False时,绘制水平箱体。类型为布尔值,默认值为True。可选参数。Dwhis:箱须的位置。类型为浮点数或浮点数二元组,默认值为1.5。可选参数。matplotlib.pyplot.boxplot(x,notch,vert,patch_artist,whis,widths,labels,**kwargs)Dx:输入数据。类型为数组或向量序列。必备参数。Dnotch:控制箱体中央是否有V型凹槽。当取值为True时,箱体中央有V型凹槽,凹槽表示中位数的置信区间;取值为False时,箱体为矩形。类型为布尔
1.切尔诺夫脸谱图(ChernoffFaces)D根据数据,将多个变量一次性展现在人脸的各个部位上,例如耳朵、头发、眼睛、鼻子等7.4对照和比较(多变量比较)
图.2008—2009赛季NBA前50位得分手的切尔诺夫脸谱图
?也称为网络图、蜘蛛图、星图、蜘蛛网图,是一种表现多维数据的图表。?将多个维度的数据量映射到坐标轴上,每一个维度的数据都分别对应一个坐标轴,这些坐标轴以相同的间距沿着径向排列,并且刻度相同。?网格线通常只作为辅助元素,将 坐标轴上的数据点用线连接起来就形成了一个多边形。2.雷达图(RadarChart,SpiderChart)
多组多维对比-多雷达链
D两款手机的综合表现雷达图:
matplotlib库polar()函数:matplotlib.pyplot.polar(theta,rp**kwargs)Dtheta:旋转角度Dr:每个标记到圆心的距离Dkwargs:关键字参数集合网格线设置函数:matplotlib.pyplot.thetagrids(angles=None,labels=None,fmt=None,**kwargs)
D通过色差、亮度来展示数据的差异,直观了解点位的聚集情况,易于理解。D热力图尤其关注分布。D热力图可以不需要坐标轴,其背景常常是图片或地图。3.热力图(HeatMap)
杭州房租热力图,用于显示杭州市房租价格分布D
seaborn.heatmap(data,vmin,vm
文档评论(0)