- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数据分布的特征量.ppt
方差合成:计算公式 公式中: 为总方差, 为总标准差 Si为各小组标准差 ni为各小组数据个数 (5.11) (5.12) 方差和标准差的性质 方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。 标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性: 如果 则 如果 则 方差和标准差:优缺点及应用 方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。 标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。 应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。 各种差异量的数值关系 当总频数相当大,且频数分布呈正态时,全距、四分为距、平均差、标准差的数值存在如下关系:全距大致等于6个标准差,7.5个平均差的距离,9各四分位距的距离。 中位数上、下各一个四分位距之间包括50%个总频数。 算术平均数上、下各一个标准差之间包括68.26%个总频数,算术平均数上、下各两个标准差之间包括95.45%个总频数,算术平均数上、下各三个标准差之间包括99.73%个总频数。 三、相对差异量 绝对差异量与相对差异量 以上介绍的差异量是带有与原观察值相同单位的名数,成为绝对差异量。一般情况下,它们可以用来比较两组数据的离散程度的大小。 但是绝对差异量不适用于:水平相差较大、同一观测的各种团体观测值离散程度的比较或同一团体不同观测值离散程度的比较。在这两种情况下需要用相对差异量来进行比较。 相对差异量即差异系数(coefficient of variation)是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以CV表示,其计算公式为: 差异系数的作用 比较不同单位资料的差异程度 比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况 根据经验,一般CV值常在5%-35%之间。如果CV大于35%时,可怀疑所求得的平均数是否失去了意义;如果CV小于5%时,可怀疑平均数与标准差是否计算有误。 可比 差异系数 身高的差异水平:cm 体重的差异水平:kg 用差异系数可以相互比较 可比 例1:比较计量单位不同的数据资料的差异程度 1975年上海市区6岁男童体重与身高数据: 平均数 标准差 差异系数 体重 19.39千克 2.16千克 11.14% 身高 115.87厘米 4.86厘米 4.19% 例2:比较单位相同而平均数相关较大的两组资料的差异程度 1975年上海市区两组女童体重的数据: 平均数 标准差 差异系数 2个月组 5.45千克 0.62千克 11.38% 6岁组 19.02千克 2.12千克 11.15% 差异系数的应用条件 差异系数主要应用于平均数不等于零的连续数据。 学科成绩可以勉强计算差异系数。 严格的说只有等比数据才可计算,因为其他数据无固定零点,任何数据都可以作为零点。 Ⅲ 偏态量和峰态量 偏态量与峰态量:概述 偏态量和峰态量也是用来描述数据分布特征的统计量。在考察数据是否呈正态分布时,恰好可以用偏态量与峰态量做比较性量度。 偏态量是描述一组数据偏离完全对称程度的一种特征量。 峰态量是描述一组数据高狭、低阔分布状态的一种特征量。 偏态量的计算及性质 当偏态量等于零时,则频数分布呈对称性;当偏态量大于零时,频数分布呈正偏态;当偏态量小于零时,频数分布呈负偏态。 峰态量的计算 一个频数分布,若算术平均数周围频数比例越大,分布形态越高狭;若算术平均数周围频数比例越小,分布形态越低阔。 SPSS软件求偏态量和峰态量的步骤 SPSS软件求偏态量和峰态量的步骤 集中量和差异量的关系 联系:二者都是一组数据的特征量,常常结合起来并匹配使用共同表示一组数据的分布特征。当集中量是中位数时,最好选择全距、四分位距等差异量与之匹配;当集中量是算术平均数时,其最佳匹配则是标准差。 区别:二者从不同角度来反映数据的特征。集中量如果在数轴上表示,它是一个点,而差异量则可表示为一段距离。集中量的代表性如何,则取决于差异量。数据的离散程度越大,数据的集中量代表性越差;反之,数据则比较整齐,分布范围比较窄,数据的集中量代表性越好。 * 相同的集中量(平均数),不同的分布状况 要反映一组数据特征的全貌,不仅需要描述其典型水平或平均水平,还需要描述数据与数据间的变异与离散度。 相同的集中量(平均数),不同的分布状况 数据的变异性或离散程度可用图形把几组数据的频数分布表作出,以进行直观地了解。 A B C 更多的时候我们需要对数据间变异与离散的程度进行精确表示。 这种用以描述一组数据变异程度或离散程度的量称为差异量 差异
文档评论(0)