第三章数据分布特征描述.pptVIP

  1. 1、本文档共92页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计应用 一种测量的平均数比单个的测量更可靠 即使用一种很准确、很可靠的仪器对同一物体进行重复测量,由于一些无法控制的因素的影响,每次得到的结果也不见得一样 (美国)国家标准与技术协会(NIST—National Institute of Standards and Technology)的原子钟非常准确,它的准确程度是每600万年误差1秒,但也并不是百分之百准确 世界标准时间是世界协调时间(Universal Coordinated Time),它是由位于法国的塞夫尔的国际计量局(BIPM)所“编辑”的。BIPM并没有比NIST更好的钟,它给出的时间是根据世界各地200个原子钟的平均时间得来的 统计应用 一种测量的平均数比单个的测量更可靠 下面是NIST的时间与正确时间的10个误差数据(秒) 长期来讲,对时间的度量并没有偏差。NIST的秒有时比BIPM的短,有时比BIPM的长,并不是都较短或较长。尽管NIST的测量很准确,但从上面的数字还是可以看出有些差异。世界上没有百分之百可靠的度量,但用多次测量的平均数比只用一次测量的结果可靠程度会更高。这就是BIPM要结合很多原子钟的时间的原因 第三章 数据分布特征描述 第一节 统计变量集中趋势的测定 第二节 统计变量离散程度的测定 第三节 变量分布偏度和峰度的描述 学习目标 1. 集中趋势各测度值的计算方法 2. 集中趋势各测度值的特点及应用场合 3. 离散程度各测度值的计算方法 4. 离散程度各测度值的特点及应用场合 偏态与峰态的测度方法 用Excel计算描述统计量并进行分析 数据的特征和度量 对于描述统计中的测度,主要可以分为三个方面来描述: 一是数据的集中趋势,反映各数据向其中心值靠拢或聚焦的程度; 二是分布的离散程度,反映各数据远离其中心值的趋势; 三是数据分布的形状,即数据分布的偏态和峰度。 数据分布的特征 数据的特征和度量 第一节 统计变量集中趋势的测定 一、测定集中趋势的意义 集中趋势(General tendency)是指分布的定位,它是指一组数据向某一中心值靠拢的倾向,或是表明一组统计数据所具有的一般水平。 对集中趋势进行测度也就是寻找数据一般水平的代表值或中心值。 对集中趋势的度量有数值平均数和位置代表值之分。 集中趋势的度量类别 数值平均数就是对所有各项数据计算的平均数。因此它能够概括反映所有各项数据的平均水平。 常用的数值平均数有算术平均数、调和平均数和几何平均数。平均的对象可理解为变量 ,平均数可记为 位置代表值是在总体中将变量值按顺序排列后得到的数列中某个特殊位置的值。 常用的位置代表值有众数、中位数和其他分位数等。 二、位置代表值—— 众数 Mo (一)众数 Mo 1.定义:众数是指总体中出现次数最多的那个数据值。频数或频率最大的标志值。 2.众数的确定 1)未分组和单项式变量数列确定众数:出现次数最多的标志值就是众数。 2)组距式变量数列确定众数:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。 1)未分组和单项式变量数列确定众数 如,某百货商店在女式旅游鞋销售中,23码的鞋销售量最多,则众数为23码。 【例3-1】 根据某班学生年龄分组资料(表4-1),求年龄众数。 表3-1 某班学生年龄分组表 2)组距式变量数列确定众数——公式 下限公式: 上限公式: 表3—1某地区年人均纯收入资料 (一)众数 3.众数的特点 (1)众数不受极端值的影响。适用于各种类型的数据。(主要用于分类数据,也可用于顺序数据和数值型数据) (2) 当变量数列为均匀分布、U型分布、J型分布时,不存在众数; (3)众数缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。 众数 (不惟一性) 无众数 原始数据: 10 5 9 12 6 8 附:分类数据的众数 (例题分析) 附:顺序数据的众数 (例题分析) 二、位置代表值—— 中位数 (二)中位数 1.定义: 中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点位置上的那个数据值或变量值。用Me来表示。 在总体中,标志值小于中位数的单位占一半;标志值大于中位数的单位也占一半。 2.中位数的确定 1)未分组数据确定中位数。 先将变量值按从小到大的顺序排列,然后根据数据个数(总体单位数)的奇偶,用相应的公式来确定中位数。 当总体单位数n为奇数时: 当总体单位数n为偶数时,:

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档