ppt 第4章 基本统计量的描述.ppt

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 SPSS基本统计分析 频数分析 计算基本描述统计量 探索性数据分析 交叉分组下的频数分析(卡方检验) 多选项分析 比率分析 涉及的统计过程: “描述统计”的全部 “比较均值”的均值过程 “多重响应”过程 用途:主要用来描述一个或多个变量的描述性统计量以及分布特征,分析变量间的关系。 统计基础:随机变量与概率分布 随机变量:有些变量在观察前事先不能确定数值,但其取值又有一定规律性。 概率(probability) :描述随机事件发生的规律性、可能性。取值界于0和1之间。 离散性随机变量:如击中次数,常用概率分布列表示具体取值的概率。 连续性随机变量:如身高、体重等变量,常用概率分布密度函数表示某取值范围的概率。 概率分布密度函数 常见的概率分布曲线 描述数据分布形状的特征量 偏度g1:分布形状的左右对称性。g1 0 ,正偏态;g1 0,负偏态 峰度g2 :以正态分布为标准,描述分布峰态的指标。g2 0 ,尖峭峰;g2 0,平阔峰 正态性检验 一、频数分析 目的:粗略把握数据的分布特征 功能: 编制频数分布表:频数、百分比、累计百分比 绘制频数分析中常用统计图:条图、饼图、直方图 计算基本描述统计量 基本操作:分析-描述统计-频率 选项按钮: 统计:选择输出统计量:集中、离散趋势、分布特征、百分位数。 图标:选择绘制的图形:条图、饼图、直方图(仅用于定量变量)。 格式:定义频数表输出格式 统计选项 计算分位数 计算常用描述统计量 频数分布表格式定义 频数分析应用举例 储户的户口、职业(分类数据):使用频数、百分比描述,累计百分比无太大意义。 储户收入水平(定序数据):除使用频数、百分比外,还有累计百分比。 取款目的排名:频数分布表输出按频数降序输出频数—格式—降序个数 数据中若存在缺失值,使用有效百分比。 取款金额(定量数据)的分析 不显示频数分析表 统计 图表:直方图 不同户口(城镇、农村)的人群取款目的分析:首先做数据拆分,再进行频数分析 二、计算基本描述统计量 目的:精确把握变量的总体分布状况。 基本操作: 描述统计-频率过程:统计 描述统计- 描述过程 描述统计- 探索过程 均值比较-均值 过程(分组显示) 用途:计算变量的集中趋势、离散趋势、偏度、峰度等指标,绘制统计图。 几个过程的基本描述统计量比较 几个过程的其他功能 描述统计- 描述 过程的独有功能 均值比较-均值过程的独有功能 三、探索性数据分析 基本操作:分析-描述统计- 探索过程 目的:对数据进行初步考察 用途: 计算整体或分组数据的描述性统计指标 输出描述性统计图:茎叶图、直方图、箱式图 正态性检验、方差齐性检验 检查数据的错误,辨认奇异值 选项:缺失值处理 1、某观测在所选择的变量中有缺失值时,该观测不参与全部分析 2、仅在与该变量有关的分析中视为缺失值 3、缺失值做为一个组别输出 例:居民储蓄调查 描述城乡居民存取款金额的差别 检查存取款金额的奇异点和极端值 对存取款金额进行正态性检验和方差齐性检验,以便进一步选择分析方法。 箱式图是在剔除了变量的极端值、奇异点后计算统计量并绘制的。中间的黑粗线为中位数,红框为四分位间距的范围,上下两个细线为最大、最小值。 四、交叉分组下的频数分析 目的:掌握多变量的联合分布特征,分析变量间的关系。 功能: 产生描述多变量联合分布的列联表 比较两个(或以上)样本率或比例差异(卡方检验) 变量间的关联度分析 1、变量关系概述 变量间的关系:有关与无关。 有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化 无关:如果一个变量的变化不引起另一个变量的变化。 列联分析——行列变量间的关系 两变量是否相互独立。 两变量是否有共变趋势。 一变量的变化多大程度上能由另一变量的变化来解释。 由此可见,期望值与观察值的差距越大,说明两变量越不独立,也就越相关。因此, Pearson卡方的表达式如下: 当为四格表时, 卡方的取值在0~∞之间。卡方值越大,行列变量的关联性越强。 界面说明 【行】:用于选择行*列表中的行变量。 【列】:用于选择行*列表中的列变量。 【层】:层变量。 【显示复式条形图】:显示复式条图。 【取消表格】:不输出行*列表。 【精确】:针对2*2以上的行*列表设定计算确切概率的方法。 注:安装SPSS时除非特别选定,否则“精确”模块一般不安装。 列联表所研究的问题 城镇和农村的储户收入水平状况相同吗? 行变量:户口 列变量:收入水平 不同班级的患病情况一致吗? 行变量:班级 列变量:患病 城乡储户认为存钱合算的比例是否相同? 行变量:户口 列变量:什么合算 1、卡方检验步骤 提出假设H0:行、列变量独立(对立假设为?) 计算检验统计量(卡方

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档