交叉表分析-汇总完整版.pdf

下载文档

10
0
约8.95千字
约 11页
2023-11-17 发布于宁夏
举报
版权申诉
保障服务

交叉表分析-汇总完整版.pdf

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

进行(jìnxíng)交叉表分析时需要(xūyào)注意：（1）卡方检验要求各单元(dānyuán)的期望频数均大于5 或小于5 的比例不能超过20% ；当样本数小于40 时，需要进行小样本的交叉表分析。即选择输出结果中的Fisher 精确检验结果（Fishers Exact Test）（2）若变量为定距以上的变量需要(xūyào)先转化为定类或定序变量 data05-02 为某公司工资数据（n=15）。使用变量性别sex、收入高低 earning 分析男女(nánnǚ)经理间薪金是否平等。可以利用data05-01 中的数据，使用变量occcat80 为工作性质分类，region 为地区，child 为每个家庭的孩子数。将child 为行变量，occcat80 为列变量，region 为控制变量选入Layer of 框中，进行交叉表分析。列联表（交叉表）分析 1、项目名称 Crosstabs 过程 4、实训原理 Crosstabs 过程用于定类数据和定序数据进行统计描述和简单的统计推断。在分析时可以产生二维至n 维列联表，并计算相应的百分数指标。 4-1 列联表分析的含义与任务在实际分析中，当问题涉及到多个变量时，我们不仅要了解单个变量的分布特征，还要分析多个变量不同取值下的分布，掌握多变量的联合分布特征，进而分析变量之间的相互影响和关系。很明显，如果还采用单纯的频数分析方 1 法显然不能满足要求。因此，我们需要借助交叉分组下的频数分析，即列联表分析。列联表分析的主要任务有两个：（1）根据样本(yàngběn)数据产生二维或多维交叉列联表。交叉列联表是两个或两个以上变量交叉分组后形成的频数分布表。（2）在交叉列联表的基础(jīchǔ)上，分析两变量之间是否具有独立性或一定的相关性。 4-2 卡方检验(jiǎnyàn) 的原理(yuánlǐ) 为了理解列联表中行变量（Ro ）和列变量（Column）之间的关系(guān x ì) ，我们需要借助非参数检验方法。通常采用的方法是卡方检验。和一般假设检验一样，卡方检验主要包括三个步骤：（1）建立零假设：行变量和列变量相互独立。（2）选择和计算检验统计量。列联表分析中的检验统计量是Pearson 卡方统计量。其公式为：（4-9-1）其中，r 为列联表的行数，c 为列联表的列数，为实际观测频数，期望观测频数。期望频数的计算公式为：（4-9-2）其中，RT 是指定单元格所在行的观测频数合计，CT 是指定单元格所在列的观测频数合计，n 是观测频数的合计。由式（4-9-1）可以看出，卡方统计量的大小取决于两个因素：一个是列联表的格子数；另一个是观测频数和期望频数的差值。在列联表固定的情况(qí ngkuàng)下，卡方统计量取值的大小取决于观测频数和期望频数的总差值。当 2 总差值越大时，卡方值也就越大，表明行列变量之间越相关；反之，当总差值越小时，卡方值也就越小，表明行列变量之间越独立。（3）得出结论并做决策(juécè) 。根据卡方统计量的概率P 值和显著性水平进行比较，做出拒绝还是接受原假设的结论。如果卡方检验(jiǎnyàn) 的概率  P 值小于显著性水平，则拒绝原假设(jiǎshè) ，认为行列变量之间不独立，两  者之间存在依存关系。反之，如果卡方检验的概率P 值大于显著性水平，则接受原假设，认为行列变量(biànliàng)之间独立，两者之间不存在依存关系。在卡方检验中还需要注意：交叉列联表中不应有期望频数小于1 的单元格，或者不应有大量期望频数小于5 的单元格。如果交叉列联表中有20% 以上单元格中的期望频数小于5 ，则不应用卡方检验，可以采