交叉表分析分析和总结.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
data05-02 为某公司工资数据( n=15 )。使用变量性别 sex 、收入高低 earnings 分析男女经 理间薪金是否平等。 可以利用 data05-01 中的数据,使用变量 occcat80 为工作性质分类, region 为地区,childs 为每个家庭的孩子数。将 childs 为行变量, occcat80 为列变量, region 为控制变量选入 Layer of 框中,进行交叉表分析。 列联表(交叉表)分析 1、 项目名称 Crosstabs 过程 4 、实训原理 Crosstabs 过程用于定类数据和定序数据进行统计描述和简单的统计推断。 在分析时可以产生二维至 n 维列联表,并计算相应的百分数指标。 4-1 列联表分析的含义与任务 在实际分析中, 当问题涉及到多个变量时, 我们不仅要了解单个变量的分布 特征,还要分析多个变量不同取值下的分布, 掌握多变量的联合分布特征, 进而 分析变量之间的相互影响和关系。 很明显,如果还采用单纯的频数分析方法显然 不能满足要求。因此,我们需要借助交叉分组下的频数分析,即列联表分析。列 联表分析的主要任务有两个: (1)根据样本数据产生二维或多维交叉列联表。交叉列联表是两个或两个 以上变量交叉分组后形成的频数分布表。 (2 )在交叉列联表的基础上,分析两变量之间是否具有独立性或一定的相 关性。 4-2 卡方检验的原理 为了理解列联表中行变量( Row)和列变量( Column)之间的关系,我们需 要借助非参数检验方法。 通常采用的方法是卡方检验。 和一般假设检验一样, 卡 方检验主要包括三个步骤: (1)建立零假设:行变量和列变量相互独立。 (2 )选择和计算检验统计量。列联表分析中的检验统计量是 Pearson 卡方 统计量。其公式为: 2 o e r c f f 2 ij ij (4-9-1 ) e i 1 j 1 f ij 其中, r 为列联表的行数, c 为列联表的列数, f 0 为实际观测频数, f e 期 望观测频数。期望频数的计算公式为: e RT CT f (4-9-2 ) n 其中, RT是指定单元格所在行的观测频数合计, CT是指定单元格所在列的 观测频数合计, n 是观测频数的合计。 由式(4-9-1 )可以看出,卡方统计量的大小取决于两个因素:一个是列联 表的格子数; 另一个是观测频数和期望频数的差值。 在列联表固定的情况下, 卡 方统计量取值的大小取决于观测频数和期望频数的总差值。 当总差值越大时, 卡 方值也就越大,表明行列变量之间越相关;反之,当总差值越小时,卡方值也就 越小,表明行列变量之间越独立。 (3 )得出结论并做决策。根据卡方统计量的概率 P 值和显著性水平 进行 比较,做出拒绝还是接受原假设的结论。 如果卡方检验的概率 P值小于显著性水 平 ,则拒绝原假设, 认为行列变量之间不独立, 两者之间存在依存关系。 反之, 如果卡方检验的概率 P 值大于显著性水平 ,则接受原假设, 认为行列变

文档评论(0)

hao187 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档