- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
地理国情监测云平台
地理国情监测云平台
“直方图”工具提供了数据的一元(一个变量)描述。此工具对话框用于显示感兴趣数据集的频率分布并计算汇总统计数据。
频率分布
频率分布是用条形图表示的,该图显示了观察值位于特定区间或组之内的频率。可指定在直方图中使用的等宽类数目。各组中数据的相对比例以各条块的高度表示。例如,以下直方图显示了数据集的频率分布(10个类)。
汇总统计数据
分布的重要功能可通过描述其位置、离散度和形状的统计数据进行概括。位置的测量值
位置的测量值提供了一个分布的中心和其他部分所处位置的概念。
平均值即为数据的算数平均值。平均值提供分布中心的测量值。
中间值与累积比例0.5对应。如果数据以升序排列,50%的值位于中间值之下,50%的值位于中间值之上。中间值提供了分布中心的另一个测量值。
第一和第三分位数分别与累积比例0.25和0.75对应。如果数据以升序排列,则25%的值位于第一分位数之下,25%的值位于第三分位数之上。第一和第三分位数是分位数的特殊情况。分位数的计算方式如下:
quantile=(i-0.5)/N其中i是第i个有序数值。离散度的测量值
平均值周围点的离散度是所显示频率分布的另一特征。
数据的方差是所有值与平均值之间的平均平方差值。由于涉及到平方差,计算得到的方差通常对过高值或过低值很敏感。方差的计算方法为:将值与平均值的平方差求和,然后除以(N-1)。
标准差为方差的平方根,它描述了数据在平均值周围的分散程度。方差和标准差越小,测量值聚类相对于平均值就越紧密。
下图显示了两个具有不同标准差的分布。黑线表示的频率分布比红线表示的频率分布波动性更大(离散程度更大)。黑线表示的频率分布比红线表示的频率分布的方差和标准差都大。
形状测量值
频率分布的形状也是其特征之一。
偏度系数是分布对称度的测量值。对于对称的分布,偏度系数为零。如果分布具有较长的大值右尾部,则为正偏分布;如果分布具有较长的小值左尾部,则为负偏分布。对于正偏分布,平均值大于中间值;对负偏分布,平均值小于中间值。下图显示了一个正偏分布。
峰度取决于分布尾部的大小,提供分布产生异常值可能性的衡量指标。正态分布的峰度等于三。具有较厚尾部的分布被称为高峰态,其峰度大于三。具有较薄尾部的分布被称为低峰态,其峰度值小于三。下图中,正态分布以红色表示,高峰态(厚尾部)分布以黑色表示。
示例
使用“直方图”工具,可通过直接观察来检查分布形状。可通过查看平均和中间值统计数据确定分布的中心位置。请注意,以下图形中的分布为钟形曲线,由于平均值和中值非常接近,分布接近于正态分布。还可以高亮显示直方图尾部的极值,并查看如何在空间上于显示的地图中放置这些值。
如果数据严重偏斜,可在数据上测试变换效果。此图显示了应用变换之前的偏斜分布。
将对数变换应用于偏斜数据,这种情况下,此变换使分布接近于正态分布。
地理国情监测云平台
地理国情监测云平台
您可能关注的文档
- 20182019年第一学期人教版五年级语文上册教学工作总结.docx
- 20182019年第一学期五年级班主任工作总结.docx
- 20182019年度第一学期四年级班主任工作总结1.docx
- 20182019三年级上册数学目标答案.docx
- 20182019五年级班下学期班主任工作计划.docx
- 20182019学年度八年级上数学练习试卷.docx
- 20182019学年度北师大版二年级上册数学教学计划.docx
- 20182019学年度第一学期英语教研组计划.docx
- 20192020学年浙江省宁波市曙光中学、雅戈尔中学、朝晖中学七年级期中数学试卷.docx
- 31251484Chapter6Electrochemistry分析和总结分析和总结.docx
文档评论(0)