讲座描述性统计分析.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS数据分析-第3讲 —《SPSS数据分析基础和实践》 主要内容 描述性统计分析 频率分析 对数据进行描述的图形化方法和数值方法 学习分析数据分布的方法 应用SPSS进行描述性数据分析的方法 常用统计图形的绘制方法和解释技巧 描述性统计分析 描述性统计和推断性统计 统计学分为描述性统计分析和推断性统计分析 描述性统计 应用分类、制表、图形以及概括性数据指标来概括数据分布特征的方法。结论不能推及总体。 推断性统计 推断性统计分析得到的结论适用于总体。 统计量 统计分析往往是从了解数据的基本特征开始的。统计上,需要把样本数据所含信息进行概括、融合和抽象,从而得到反映样本数据的综合指标,这些指标称为统计量。 描述性统计分析指标 统计量可分为两类 一类表示数据的中心位置,例如均值、中位数、众数等 一类表示数据的离散程度,例如方差、标准差、极差等用来衡量个体偏离中心的程度。 频率分析 频率分析主要通过频率分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征 频率分析术语 频率 对于定性观测值时,把它们按照某种原则分成一些组,每个观测值必须落入一个类并且只能够落入一个类中。对于给定的类,落入这个类的个案数称为频率 落入该类中的个案数和个案总数的比例称为相对频率 案例 数据文件Employ Data.sav记录了某公司职工的基本信息,例如性别、民族、出生日期、教育水平、工资水平、工作年限等。 教育水平为分类变量,它有11个类别。 SPSS频率分析 选择【分析】→【描述统计】→【频率】 频率分析选项-统计量 频率分析选项-图表 频率分析的结果解释 频率表格 条形图、直方图 中心趋势的描述 均值 中位数 众数 5%截尾均值 均值 均值即数据的算术平均数,是数据中心趋势的主要度量指标, 设变量有n个测量值,则算术均值为: 均值的特点 最常用的中心位置度量 受极端值影响 例:1,3,5,7,9 和 1,3,5,7,14 中位数 重要的中心位置度量 在递增排序后的数据列中 若数据个数为奇数,中位数是正中央的数 若数据个数是偶数,中位数是正中央的两数的平均值. 不受极端值的影,例如:1,5,7,3,9 众数 发生频数最高的数据值 不受极端值的影响 众数可能不存在 可能有多个众数(单峰,双峰,多峰) 可用于定量或定性数据 5%截尾均值 避免了极端值的影响 离散趋势 假设我们有以下的三组观测值: 观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20 这三组观测值的均值都是15.5,那么这三组数据是否相似呢? 离散趋势 离散趋势的描述 极差(range) 方差(Variance) 标准差(S.d.) 分位数( Percentage) 变异指标 极差 极差=最大值-最小值 受极端值影响较大 方差和标准差 方差 标准差 变异系数 在比较两组数据离散程度大小时,如果数据的测量尺度相差太大,直接比较二者的标准差并不合适。 需要首先消除测量尺度和量纲的影响。变异系数可以剔除这些影响,其计算公式为: 分位数 第p百分位数 使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值 如何计算? 将原数据从小到大排列 计算i=(p/100)n 若i是整数, 则第p百分位数为第i 与第 i+1 项的平均 若i不是整数,则向上取整。 总结五数 最大值、第一个四分位数、中位数、第三个四分位数、最大值 从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现 分布的形状 偏度 当偏度0时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左 当偏度0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右 当偏度为0,分布对称 峰度 峰度 3,分布为高峰度,即比正态分布的峰要陡峭; 3,分布为低峰度,即比正态分布的峰要平坦些;=0,分布为正态峰。 SPSS描述性统计 许多菜单均可进行描述性分析,提供描述性统计指标的输出。例如T检验、方差分析、因子分析等 SPSS自定义表模块也可以产生大部分的描述性统计指标 SPSS中的菜单 专门的描述性统计菜单: 描述(D):该过程则进行一般性的统计描述; 探索(E): 该过程用于对数据概况不清时的探索性分析; 交叉表(C):该过程完成分类数据的统计描述和一般的统计检验,我们常用的 检验也包含在该对话框中。 频率:实例 【分析】→【描述】→【频率】 频率:实例-统计量的选择 频率:实例-结果的解释 频率:结果的解释 描述性子

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档