第2讲.SPSS描述性统计相关分析.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
章描述性统计分析 本章主要内容: 频数分析 描述统计分析 探索性分析 列联表分析 统计分析的目的,是研究总体的数量特征。但 是,实践中能够得到的往往是从总体中随机抽 取的一部分观察对象,它们构成了样本。通过 对样本样本的研究,来对总体的实际情况作出 可能的判断。 因此,在数据收集、整理完毕,进行深入分析 之前,首要的工作就是去了解数据的整体情 况,随后才能做深入的推断。 为了实现上述的分析,往往有两种实现方式: )数值计算,通过数值来准确的反映数据的 基本统计特征;)图形绘制,即绘制常见的 基本统计图形,通过图形来直观展现数据的分 布特点。通常,两种方式混合使用。 的许多模块均可完成描述性分析,但专 门为该目的而设计的几个模块则集中在菜单栏 的“分析→描述统计”子菜单中。 频数分析概述: 频数分析是描述性统计中最常用的方法之一,他能够了解变量 取值的状况,对把握数据分布特征非常有用。 频数分析过程是专门为产生频数表而设计的。它不仅可以产生 详细的频数表,还可以按要求给出某百分位的数值以及常用的 条形图、饼图等统计图。 整体分析与设计的内容 频数分析 一、操作(实践数据:产品的销售量) )菜单“分析→描述统计→频率”。 )对话框中,左侧选择一个或多个 待分析变量,移入右侧。 )“显示频率表格”,勾选该复选 框,可输出频数分析表。 整体分析与设计的内容 频数分析 二、几个重要的设置对话框 “统计量”按钮对应的对话框: )四分位数:显示、、的分位数。 )割点:勾选后可输入数值,将数据平分为等分。例如,输入,表示输出、、、的百分位数。 )百分位数:选中后,可激活右侧的文本框和列表。可输入、更改和删除自定义的百分位数。 输出反映数据离散程度的统计量。 输出反映数据集中程度的统计量。 输出描述数据分布形状及特征的统计量。 整体分析与设计的内容 频数分析 “图表”按钮对应的对话框: 注: )选择直方图选项,则不能再设置图表值 选项。 )在选中直方图选项后,可以进一步选择 在直方图上显示正态曲线。 )仅适用于连续型的数值型变量。 “格式”按钮对应的对话框: 将所有变量集中在一个图形中输出,以便比较。 每个变量单独输出一个图形。 控制频数表输出的分类数量,当频数表的分组数大于设定值时,禁止其输出。用以避免产生巨型表格。 整体分析与设计的内容 的频数分析 基本统计信息汇总表。表示进行统计分析的样本总量;表示有效样本量:表示缺失样本数目。 列出了销售数据的四分位数 频数分析表。表示变量值落在某个区间(或类别)中的次数;是各频数占总样本数的百分比; 是有效百分比; 是累积百分比,指各百分比逐级累加起来的结果。 三、输出结果分析 整体分析与设计的内容 的频数分析 从图形特征看,数据呈右偏分布。历史销售数据总体数值偏 大;同时,最大值“”差不多是最小值“”的一倍,说明这种产品的销售量不是很稳定,具有较大的波动性。 整体分析与设计的内容 的描述统计分析 一、原理 统计量是研究随机变量变化综合特征的重要工具,描述性统 计量的分类如下: 对数据特征的描述 集中趋势 离散程度 分布形态 均值 众数 中位数 其他指标 全距 标准差 方差 离散系数 其他指标 偏度 峰度 整体分析与设计的内容 的描述统计分析 、集中趋势 集中趋势是指一组数据向某一中心值靠拢的倾向。 均值():反映了某变量所有取值的集中趋势或平均水平。 均值往往会受到异常大和异常小的数值影响,所以对于严重的偏态分 布,均值会失去应有的代表性。 众数():分布数列中最常出现的标志值,频数或频率最大。 众数适用于单峰对称的情况。对于多峰的分布则不适用。 中位数():指将分布数列中各单位的标志值依其大小顺序排列,位于中间位置的标志值称为中位数。 中位数来描述连续变量,会损失很多信息。例如,其他变量比中位数大多少或小多少等。 整体分析与设计的内容 的描述统计分析 、刻画离散程度的描述性统计量 离散程度是指一组数据远离其中心值的程度,即考察数据分布的 疏密程度。 全距():也称“范围”,是数据中最大值和最小值之差,又称“极差”。 最大值 最小值 全距说明了数据的整体变动范围,但不能反映其间变量分布情况。 标准差( ):指变量取值距离均值的平均离散程度的统计量。 方差():是标准差的平方。 方差在使用上存在一点不足:量纲不统一。 整体分析与设计的内容 的描述统计分析 、刻画分布形态的描述性统计量 分布形态是指数据是否对称,偏斜程度如何,分布陡缓程度如何等。 偏度():是描述变量取值分布形态对称性的统计量。

您可能关注的文档

文档评论(0)

开心就好 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档