spss第四章描述统计简介.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss第四章描述统计简介

* * 二、描述样本分布特征的统计量 1.峰度:描述某变量所有取值分布形态陡缓程度的统计量。 峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。 * * 二、描述样本分布特征的统计量 2.偏度:描述某变量所有取值分布形态的对称性的统计量简称SK。 偏度为0表示其数据分布形态与正态分布偏度相同,左右对称;偏度大于0表示正偏差数值较大,为正偏和称右偏,有一条长尾拖在右边;偏度小于0则相反。 SK的绝对值大于1时,被称为高度偏态分布,当SK的绝对值大于0.5小于1时被称为中等偏态分布。 * * * * * * 三 样本数据的离散特征 本部分应掌握的主要内容 (一)对样本数据离散特征的点状描述:极值、四分点与百分位点 (二) 对样本数据离散特征的区间描述:极差、四分位距与离差 (三) 离散状况的统计描述:样本方差 * * (一) 样本数据的离散特征 离 散 特 征 点状描述 区间描述 极值 四分点 百分位点 极差 极差四分位距 离差平方和 样本离差 * * 1.对样本数据的离散特征点状描述 1)极大值(Maximum)与极小值(Minmum): 这两个样本值从一定视角反映了样本数据 集合中样本值的离散状况。 2)下四分点(Lower Quartile)与上四分点 (Upper Quartile) 3)上下百分位点(Percentile) * * 下四分点与上四分点 下四分位点:把排序后的样本数据集合分成左右两部分,使左面部分包含25%的样本总个数,右边部分包含75%的样本总个数。 下四分位点Q1的位置=(n+1)*0.25 Q1 * * 下四分点与上四分点 上四分位点:把排序后的样本数据集合分成左右两部分,使左面部分包含75%的样本总个数,右边部分包含25%的样本总个数。 上四分位点Q3的位置=(n+1)*0.75 Q3 * * 下四分点Q1的值与上四分点Q3的值 当下四分位点与上四分位点的位置为整数时,相应整数位置上的样本值就是Q1,Q3的值。当下四分位点的位置与上四分位点的位置不为整数时,Q1,Q3的计算公式: Q1=Q1位置左边的样本值+(Q1位置右边的样本值-Q1位置左边的样本值)*0.25 Q3=Q3位置左边的样本值+(Q3位置右边的样本值-Q3位置左边的样本值)*0.75 * * (二) 对样本数据离散特征的区间描述:极差、四分位距与离差 1.极差(range):极大值与极小值之差。 极差受到极端值的影响,只利用了一组数据两端 的信息,不能反映出中间数据的分散情况, 所以有一定的局限性。 * * 顺序数据离散程度的度量 3.四分位距(Interquartile Range): 样本数据排序后的上四分位点与下四分位点之差。 四分位距反映了中间50%数据的离散程度:其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。四分位距不受极值的影响。 * * Q3 Q1 * * 数值型数据离散程度的度量 4.样本离差与离差平方和(Sample Deviations Or Sum of Squared Deviations) * * (三) 离散状况的统计值描述:样本方差 样本方差(Sample Variance):离差平方和与n-1的比值。 样本方差的含义:通过消除样本个数对“偏离情况”的影响,以便较为客观地反映样本数据对样本均值的平均偏离情况。样本方差s2的计算公式: * * * * (四)分类数据离散程度的度量 异众比率:非众数组的频数占总频数的比率。用来衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性就越大。 * * 异众比率的计算 如:一次调查结果显示,大学生对垃圾分类行为的认识状况如下: 没有必要,没有必要,没有必要,有必要,有必要,有必要,有必要,有必要,有必要,无所谓 频数:没有必要(3),有必要(6),无所谓(1) 众数=6,非众数=4,异众比率=4/10=40% 表示“有必要”选项这一众数对垃圾分类行为的认识状况的代表性中有40%无法代表。仅有60%的代表性。 * * 实习1:样本数据特征的初步分析 打开数据文件:“描述统计量.sav” 描述学生的各门成绩与总成绩等指标的如下初步统计特征: 1.各门成绩的集中趋势如何? 2.总成绩的离散程度如何? 3.总成绩的分布规律如何? * * 实习:连续数据样本离散统计量 样本1:50,50.02 ,49.99,50.01

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档