统计学 数据分布特征地描述.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学 数据分布特征地描述

第三章 数据分布特征的描述 第三章 数据分布特征的描述 对单变量截面数据的特征描述,主要有四个方面:集中趋势、离散程度、偏态与峰度。 第三章 数据分布特征的描述 第一节 统计变量集中趋势的测定 一、测定集中趋势的指标及其作用 集中趋势(Central tendency) 较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,使得全部数据呈现出向中心聚集或靠拢的态势。 测度集中趋势的指标有两大类: 数值平均数——是根据全部数据计算得到的代表值,主要有算术平均数、调和平均数及几何平均数; 位置代表值——根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。 测定集中趋势指标的作用 1.反映变量分布的集中趋势和一般水平。 如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。 2.可用来比较同一现象在不同空间或不同阶段的发展水平。 不受总体规模大小的影响; 在一定程度上使偶然因素的影响相互抵消。 3.可用来分析现象之间的依存关系。 如研究劳动者的文化程度与收入的关系。 4.平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。 二、数值平均数 (一)算术平均数(均值) 一组数据的总和除以这组数据的项数所得的结果; 最常用的数值平均数。 1.简单算术平均数 把每项数据直接加总后除以它们的项数。 通常用于对未分组的数据计算算术平均数。 计算公式: 二、数值平均数 二、数值平均数 2.加权算术平均数 加权算术平均数的计算公式: 权数(fi ,也称权重) 权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。可以是绝对数形式,也可以是比重形式(如频率)来表示。 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。 二、数值平均数 二、数值平均数 3.由组距数列计算算术平均数 各组变量值用组中值来代表。 假定条件是各组内数据呈均匀分布或对称分布。 计算结果是近似值。 二、数值平均数 4.对相对数求算术平均数 由于各个相对数的对比基础不同,采用简单算术平均通常不合理,需要加权。 二、数值平均数 5.算术平均数的主要数学性质 (1)算术平均数与变量值个数的乘积等于各个变量值的总和 (2)各变量值与算术平均数的离差之总和等于零 (3)各变量值与算术平均数离差平方之总和为最小 二、数值平均数 二、数值平均数 (二)调和平均数(Harmonic mean) 调和平均数也称为倒数平均数。各变量值的倒数(1/xi)的算术平均数的倒数。其计算公式为: 二、数值平均数 【例】某企业产品的加工要顺次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为88%、85%、90%、92%、96%,试求这五道工序的平均合格率。 本例中各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,所求的平均合格率应为: 二、数值平均数 (三)几何平均数(Geometric mean) 几何平均数— n个变量值连乘积的n次方根。 简单几何平均数 加权几何平均数 适用于各个变量值之间存在连乘积关系的场合。 主要用于计算现象的平均发展速度; 也适用于对某些具有环比性质的比率求平均。 二、数值平均数 数值平均数小结: 三、众数与中位数 (一)众数(Mode) 众数是一组数据中出现频数最多、频率最高的变量值,常用 Mo 表示。 如表3-2中年龄的众数值Mo=25。 众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。 可用来测度定性变量的集中趋势; 销售量最大的产品颜色是“白色”,则有Mo=“白色”。 可以度量定量变量的集中趋势。 从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。 组距数列中众数的确定 先找到众数组。 在等距数列中,众数组就是次数最多的组; 在异距数列中,众数组应是频数密度最大的组。 根据众数组与其相邻两组的次数差来推算。 其近似公式为: 第二节 统计变量离散程度的测定 测度集中趋势的指标有两大类: 数值平均数——主要有算术平均数、调和平均数及几何平均数; 位置代表值——主要有众数和中位数。 测度离中趋势的指标也有两大类: 数值平均数的代表性——主要有极差、平均差、方差和标准差、离散系数; 位置代表值的代表性——主要有四分位差、异众比例。 第二节 统计变量离散程度的测定 一、测定离散程度的指标及其作用 1.说明数据的分散程度,反映变量的稳定性、均衡性。 数据之间差异越大,变量的稳定性或均衡性越差。 2.衡量平均数的代表性。 离散程度越大,平均数的代表性就越小。 3. 统计推断的重要依据 判别统计推断前提条件是

文档评论(0)

jyf123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6153235235000003

1亿VIP精品文档

相关文档