第十章卡方检验分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 卡方检验 卡方分布就是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。 不同于回归分析以及 t 检验和方差分析(三者都属于参数统计),它属于自由分布的非参数检验(非参数统计)。 它可以处理一个因素分为多种类别或多种因素各有多种类别的资料。 凡是可以应用比率进行检验的资料,都可以用卡方检验。 卡方检验是用途很广的一种假设检验方法。例如,它包括两个或多个样本率及构成比之间的差别有无统计意义的推断,分类变量配对设计下的卡方检验以及频数分布的拟合优度检验等。 在社会统计学中应用最多的用于分类变量之间拟合优度和独立性检验的 χ2 检验。 χ2 检验可以判断变量之间是否相关,但,不能判断相关程度为多大。 φ 系数,克拉默 V 系数。它们用于判断变量之间相关程度的大小,但是这两个系数的应用也有其局限性。 卡方统计量 χ2 可以用于变量之间的拟合优度检验和独立性检验,测定两个分类变量之间的相关程度。 χ2 统计量表达式为: 其中,f0 是观察值,fe 是期望值。 χ2 统计量是平方和的加总,因而,χ2 ≥ 0 。 χ2 值的大小与变量的个数有关,即观察值和期望值配对数越多,χ2 值越大,因而,χ2 统计量的分布与自由度有关。 χ2 统计量描述的是观察值与期望值之间的接近程度,两个越接近, 越小,χ2 越小。 反之, 越大,χ2 越大。 举例说明 某车间有甲,乙,丙三个技工进行生产,上周甲,乙,丙三个人产量分别占总量的 58%,33% 和 9%,丙进行学习,想提高技术。一周后三人产量共生产了 270 件产品,其中甲,乙,丙三人分别生产 150 件,85 件和 35 件。请判断丙学习后三人产量占的比例是否发生了变化。 在这个例子中,假定三人产量所占比例没有变化,那么甲,乙,丙三人产量期望值分别为: 通过差卡方分布表得到 χ20.05 (2) = 5.99 χ2 = 5.1783,所以认为丙学习后三人产量所占比例没有发生变化。 自由度 = k-1= 3-1 = 2 卡方检验的概念 (一)卡方检验:多个总体的比较 从总体的不同类别中抽取元素构成样本,样本包含总体中各个类别的元素,对不同类别的目标量之间是否存在显著性差异进行的检验称为拟合优度检验。 拟合优度检验是 χ2 检验中重要的一部分,可以同时对多个总体进行比较。 在 χ2 检验中,如果 χ2 χ2α (k-1),则拒绝虚无假设。χ2α (k-1) 为给定值,其中(k-1)是自由度。自由度是可以自由变动的变量个数,在列联表中,自由度 = (R-1)× (C-1)。 例如,从某学校社会学,经济学,文学,信息学四个专业中随机抽取 420 名学生针对学校宿舍管理改革的态度进行调查。调查结果如下表所示,以 α = 0.05 的显著性水平检验四个专业的学生对宿舍管理改革的看法是否存在差异。 首先,我们假设四个专业的学生之间不存在差异,即四个专业的学生赞成改革的比例是一致的,即均为 自由度 = (R-1)×(C-1)=(2-1)×(4-1)= 3 α = 0.05,查表得:χ2α (3) = 7.815 由于 χ2 χ2α (3),所以我们不能拒绝虚无假设,即认为四个专业的学生对宿舍管理改革的赞成是一致的,调查数据中的差异是由于抽样的随机性造成的。 (二)适用场合:分类变量之间的关系 χ2 检验用于分类变量之间关系的检验,可以判断不同类别的目标量之间是否存在显著差异。 χ2 检验主要用来检验频数问题,即检验各类实际观察的频数是否显著不同于假设的期望频数。 同时,χ2 检验还可用于判断两个分类变量之间是否存在联系;这时称 χ2 检验为对立性检验。如果连个分类变量之间没有关系,则称二者相互独立。 独立性检验 例如,我们分析阅读习惯于学历是否有关。随机抽取 254 人进行调查,调查结果如下表: 在这个例子中,我们假设阅读习惯于学历没有关系,即二者是相互独立的,故有: Ho:阅读习惯与学历没有关系 Ha:阅读习惯与学历有关系 我们需要利用 χ2 检验来进行独立性检验,这时候需要计算 χ2 统计量,而 χ2 统计量是根据观察值和期望值计算得出来的。 因而,首先,我们需要计算期望值。根据列联表中任一单元格频数的期望值公式来求期望值: 其中,RT 是给定单元格所在行的合计;CT 是给定单元格所在列的合计;n 为观察值的总个数,即样本容量。 例如: 所以: 取 α =

文档评论(0)

w447750 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档