网站大量收购独家精品文档,联系QQ:2885784924

2013数据分析方法(基本统计分析).ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2013数据分析方法(基本统计分析)

2.4.3 交叉分组下的频数分析 目的和任务 交叉列联表的主要内容 交叉列联表行列变量间关系的分析 基本操作 应用举例 SPSS中列联表分析的其他方法 1) 目的和基本任务 1、目的:交叉分组下的频数分析又称列联表分析。通过前面的频数分析能够掌握单个变量的数据分布情况,在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,进而分析变量之间的相互影响和关系。对于这种涉及两个或两个以上变量分布情况的研究通常要利用交叉分组下的频数分析来完成。 2、基本任务: 1)根据收集到的样本数据,产生二维或多维交叉列联表; 2)在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析。 2) 交叉列联表的主要内容 编制交叉列联表是交叉分组下频数分析的第一个任务。交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。 例:职工基本情况数据按职称和文化程度编制的二维交叉列联表(见下页表): 列边缘分布 列变量Column 行变量Row 列标题 列标题 行边缘分布 条件分布 行百分比 列百分比 总百分比 观测频数 3) 交叉列联表行列变量间关系的分析 对交叉列联表中的行变量和列变量之间关系进行分析是交叉分组下频数分析的第二个任务。 大多数情况下,观测频数分散在列联表的各个单元格中,不容易直接发现行列变量之间的关系强弱程度,此时就要借助非参数检验方法。通常用的方法是卡方检验。 交叉列联表的卡方检验 卡方检验属假设检验的范畴,步骤如下: (1) 建立原假设 在列联表分析中卡方检验的原假设为行变量与列变量独立 (2) 选择和计算检验统计量 列联表分析卡方检验统计量是Pearson卡方统计量,其数学定义为: 其中,r为列联表的行数,c为列联表的列数; 为观察频数, 为期望频数(Expected Count)。期望频数的计算方法是: 其中,RT是指定单元格所在行的观测频数合计,CT是指定单元格所在列的观测频数合计,n是观测频数的合计。 期望频数的分布反映的是行列变量互不相干下的分布。 (3) 确定显著性水平和临界值 显著性水平(Significant Level) 是指原假设为真却将其拒绝的风险,即弃真的概率。通常设为0.05或0.01。在卡方检验中,由于卡方统计量服从自由度为(行数-1)×(列数-1)的卡方分布,因此,在行列数目和显著性水平确定时,卡方临界值是可唯一确定的。 (4) 结论和决策 对统计推断做决策通常有两种方式: 根据统计量观测值和临界值比较的结果进行决策。如果卡方观测值大于临界值,则认为实际分布与期望分布之间的差距显著,可以拒绝原假设,断定列联表的行列变量间不独立,存在相关关系;反之,接受原假设。 根据统计量观测值的概率p值和显著性水平 比较的结果进行决策。 利用p值进行检验(决策准则) 若p-值 ?,不拒绝 H0 若p-值 ?, 小概率事件发生,拒绝 H0 p值是抽样分布中大于或小于样本 统计量的概率;被称为观察到的 (或实测的)显著性水平。 4) 基本操作 (1) 菜单选项分析Analyze?描述统计Descriptive Statistics ?交叉表Crosstabs,出现窗口如下: 该框中的变量作为分布表中的行变量和列变量 该框中的变量作为控制变量,决定频数分布表中的层,可有多个控制变量。 显示每一组中各变量的分类条形图。 只输出统计量,不输出多维列联表。 交叉表Crosstabs 对话框 (2) 如果进行二维列联表分析,则将行变量选择到Row(s)框中,将列变量选择到Column(s)框中。如果Row(s) 和Column(s)框中有多个变量名,SPSS会将行列变量一一配对后产生多张二维列联表。如果进行三维或多维列联表分析,则将其他变量作为控制变量选到Layer框中。多控制变量间可以是同层次的,也可以是逐层叠加的,可通过Previous或Next按钮确定控制变量间的层次关系。 单元显示Cell Display 对话框 输出观测量的实际数量 输出期望的观测值的数量 输出单元格中观测量的数目占整行全部观测量数目的百分比 输出单元格中观测值的数目占整列全部观测量数目的百分比 输出单元格中观测量的数目占全部观测量数目的百分比 统计量和格式对话框 指定用哪种方法分析行变量和列变量间的关系 输出排列顺序 5) 应用举例 利用居民储蓄调查数据进行分析,实现以下目标: 1、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度。 2、分析城镇和农村储户对什么合算的认同是否一致(自己练习)。 居民储蓄调查数据.sav 分析:1、该问题列联表的行变量为户口,列变量

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档