交叉表分析-汇总完整版.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
进行(jìnxíng)交叉表分析时需要(xūyào)注意: (1)卡方检验要求各单元(dānyuán)的期望频数均大于5 或小于5 的比例不能 超过20% ;当样本数小于40 时,需要进行小样本的交叉表分析。即选择输出 结果中的Fisher 精确检验结果(Fishers Exact Test) (2)若变量为定距以上的变量需要(xūyào)先转化为定类或定序变量 data05-02 为某公司工资数据(n=15)。使用变量性别sex、收入高低 earning 分析男女(nánnǚ)经理间薪金是否平等。 可以利用data05-01 中的数据,使用变量occcat80 为工作性质分类,region 为地区,child 为每个家庭的孩子数。将child 为行变量,occcat80 为列变 量,region 为控制变量选入Layer of 框中,进行交叉表分析。 列联表(交叉表)分析 1、项目名称 Crosstabs 过程 4、实训原理 Crosstabs 过程用于定类数据和定序数据进行统计描述和简单的统计推断。 在分析时可以产生二维至n 维列联表,并计算相应的百分数指标。 4-1 列联表分析的含义与任务 在实际分析中,当问题涉及到多个变量时,我们不仅要了解单个变量的分 布特征,还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征, 进而分析变量之间的相互影响和关系。很明显,如果还采用单纯的频数分析方 1 法显然不能满足要求。因此,我们需要借助交叉分组下的频数分析,即列联表 分析。列联表分析的主要任务有两个: (1)根据样本(yàngběn)数据产生二维或多维交叉列联表。交叉列联表是 两个或两个以上变量交叉分组后形成的频数分布表。 (2)在交叉列联表的基础(jīchǔ)上,分析两变量之间是否具有独立性或一定 的相关性。 4-2 卡方检验(jiǎnyàn) 的原理(yuánlǐ) 为了理解列联表中行变量(Ro )和列变量(Column)之间的关系(guān x ì) ,我们需要借助非参数检验方法。通常采用的方法是卡方检验。和一般假设 检验一样,卡方检验主要包括三个步骤: (1)建立零假设:行变量和列变量相互独立。 (2)选择和计算检验统计量。列联表分析中的检验统计量是Pearson 卡方统 计量。其公式为: (4-9-1) 其中,r 为列联表的行数,c 为列联表的列数, 为实际观测频数, 期 望观测频数。期望频数的计算公式为: (4-9-2) 其中,RT 是指定单元格所在行的观测频数合计,CT 是指定单元格所在列 的观测频数合计,n 是观测频数的合计。 由式(4-9-1)可以看出,卡方统计量的大小取决于两个因素:一个是列联 表的格子数;另一个是观测频数和期望频数的差值。在列联表固定的情况(qí ngkuàng)下,卡方统计量取值的大小取决于观测频数和期望频数的总差值。当 2 总差值越大时,卡方值也就越大,表明行列变量之间越相关;反之,当总差值 越小时,卡方值也就越小,表明行列变量之间越独立。 (3)得出结论并做决策(juécè) 。根据卡方统计量的概率P 值和显著性水平 进行比较,做出拒绝还是接受原假设的结论。如果卡方检验(jiǎnyàn) 的概率  P 值小于显著性水平 ,则拒绝原假设(jiǎshè) ,认为行列变量之间不独立,两  者之间存在依存关系。反之,如果卡方检验的概率P 值大于显著性水平 ,则 接受原假设,认为行列变量(biànliàng)之间独立,两者之间不存在依存关系。 在卡方检验中还需要注意:交叉列联表中不应有期望频数小于1 的单元 格,或者不应有大量期望频数小于5 的单元格。如果交叉列联表中有20% 以上 单元格中的期望频数小于5 ,则不应用卡方检验,可以采

文档评论(0)

151****5730 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档