网站大量收购独家精品文档,联系QQ:2885784924
  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPPS

第五章 描述性统计分析 描述性统计只对统计数据的结构和总体情况进行描述,并不能深入了解统计数据的内部规律。 Spss的许多模块都可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在descriptive statistics菜单中,他们就是计算各种统计量或绘制统计图来实现描述功能。 descriptive statistics菜单主要内容 1 频数分布表分析 Frequencies :其特色就是产生频数表,对分类数据和定量资料都适用。 2 统计描述分析 Descriptive 进行一般性描述,适用于服从正态分布的定量资料。 3 Explore 过程:用于对数据分布状况不清楚时的探索性分析,它会杂七杂八给出一大堆可能用到的统计指标和统计图,让研究者参考。 4 Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验我们常用的X2 检验也在其中完成 5 Ratio过程;用于对两个连续性变量计算相对比指标,它可以计算出一系列非常专业的相对比描述指标。 常用的描述统计量 集中趋势指标(central tendency):均数(means) 众数(mode),中位数( median),总和 (sum), 离散趋势指标:标准差(standard deviation),方差等,最大值、最小值等。其中标准差方差只适用正态分布。 百分位数指标(percentile):包括四分位数,各个百分位数等,适用于任何分布类型资料。 分布指标 distribution :偏度系数(Skewness)和峰度系数 Kurtosis ,反映了数据偏离正态分布的程度 其它:M统计量 M-estimators 、极端值 outlier 等,主要用于对存在异常值的数据进行描述;标准误(S. E. mean),标准误则反映了样本均数的波动程度。 描述集中趋势的统计量 1 均值 mean : 表示某变量所有变量值集中趋势或平均水平的统计量。 适用于定距数据。 特点:利用了全部数据,易受极端值的影响。 2 众数 mode 在frequency菜单中计算 一组数据中出现频数最多的变量值。 例:服装尺码 适用于各类数据,主要用于定类数据。 特点:众数可能不唯一,不受极端值的影响。 计算描述统计量 描述离散程度的统计量 1 标准差 standard deviation--Std Dev 2 方差 variance 3 极差 range : 最大值 minimum -最小值 minimum 极差很小表明所有数据几乎集中在一起 应用于相同样本容量的两组数据离散程度比较 计算描述统计量 描述对称程度的统计量 偏度 skewness : 描述某变量所有变量值分布形态的偏斜程度和方向的统计量. 偏度为0表示对称; 大于0表示正偏差大 右偏 ,频数最大的值比均值小,极值大于均值; 小于0表示负偏差大 左偏 。Σ ? niiSDxx133/ 1-n1Skewness 计算描述统计量 描述陡峭程度的统计量峰度 kurtosis :描述某变量所有变量值分布形态陡缓程度的统计量。峭度为0表示与正态分布峭度相同。大于0表示比正态分布陡,尖峰。小于0表示比正态分布缓;平峰。其他:标准误差 S. E. mean 补充:百分位数percentile 百分位数提供了数据值如何在最小值和最大值之间分布的信息。对不含多个重复数值的数据来说,第p个百分位数把数据分位两部分:大约p%的观察值小于第第p个百分位数;大约 100-p)% 的观察值大于第p个百分位数。第p个百分位数定义如下:至少有P%的观察值与它一样大或比它小;至少有 100-p)% 的观察值大于它或与它一样大。 第p个百分位数的计算: 1,按升序排列(从大到小) 2,计算指数I : i p/100 * n,其中p为百分位数;n为观察值数。 3,如果i不是整数,则取整。比i大的下一个整数就是第p个百分位数的位置;如果i是整数,则第p个百分位数的第i个和第i+1个数的平均数。 举例:下面是一组12个起薪数据,请确定第85个百分位数: 1,按升序排列数据:2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825 2,计算 I : i 85/100 *12 10.2 3, 因为I 不是整数,取整10,则第85个百分位数就是大于10.2的下一个整数,即第11个数 2630。 如果求第50个百分位数:i 50/100 *12 6,i为整数,一次第50个百分位数(中位数):(2390+2420)/2 2405 5.1 frequencies过程 频数分布表是描述性统计中最常用的方法之一,Frequencies 过程就

文档评论(0)

cj80011 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档