卡方检验原理与应用实例.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卡方检验原理与应用实例 卡方检验原理与应用实例 : 本文简单介绍卡方检验的原理和两个类型的卡方检验实例。 一、卡方检验的作用和原理 卡方检验的作用:简单来说就是检验实际的数据分布情况与理论的分布情况是否相同的假设检验方法。怎么理解这句话呢,拿一个群体的身高来说,理论上身高低于 1 米 5 的占 10%,高于 2.0 的占 10%,中间的占 80%,现在我们抽取了这个群体中的一群人,那么对应这三个身高段的人数的比例关系是不是 1:8:1 呢?卡方分析就是解决这类问题。 卡方检验的原理:上面已经提到卡方检验是检验实际的分布于理论的分布时候一致的检验,那么用什么统计量来衡量呢!统计学家引入了如下的公式: Ai 为 i 水平的观察频数,Ei 为 i 水平的期望频数,n 为总频数,pi 为 i 水平的期望频率。i 水平的期望频数 Ti 等于总频数 n×i 水平的期望概率 pi,k 为单元格数。当 n 比较大时,χ2 统计量近似服从 k-1(计算 Ei 时用到的参数个数) 个自由度的卡方分布。和参数检验的判断标准一样,这个统计量有一个相伴概率 p。零假设是理论分布与实际分布是一致的,所以如果 P 小于 0.05,那么就拒绝原假设,认为理论和实际分布不一致。 二、适合性卡方测验 所谓适合性检验就是检验一个样本的分布是否符合某个分布的一种假设检验方法。比如说检验数据是否正态分布,是否成二项分布或者平均分布等等。拿正态分布来说吧!请看下图 在这个近似标准正态分布的玉米株高的分布中,横轴代表的是株高的数据,而纵轴代表的是对应株高的频数,简单来说,正态曲线上的某点的纵坐标代表的就是这个点对应的横轴坐标显示株高的玉米有多少株。只不过正态分布曲线上显示的是频率值,而频率=该组株数/总的株数,所以分布曲线不会变,只不过纵坐标由频数变为频率。这也解释了昨天推送的《如何判断数据是否符合正态分布》中用带正态曲线的直方图判断数据是否符合正态分布的原理。 回到本节,当我们要检验玉米株高是否符合正态分布时,我们能够通过计算, 计算出当样本量为 600(注意本例株高数据的个案数为 600,下载数据资料进行练习过的学员应该知道)时,每个株高下的玉米株数设为 E,然后我们已经有实际值 设为 A,然后我们带入上面的公式计算得到卡方统计量,由 SPSS 输出相伴概率,我们就能判断数据是否符合正态分布了。 再说一个例子。 这里假设理论上我们认为车祸每天发生的数量相同,就计算出每天车祸发生的 这里假设理论上我们认为车祸每天发生的数量相同,就计算出每天车祸发生的 理论发生数为 22.8,而实际上每天车祸发生的数目并不是这样,那么这种不同是显著不同于理论分布呢,还是只是抽样引起的呢?需要用卡方进行检验。我 们计算得到卡方统计量和相伴概率,就能够判断车祸实际每天发生的数量是就是理论上认为的应该相同了。 下面给出 SPSS 的操作过程: 1)选择非参数检验下的旧对话框按钮-点击卡方检验,然后把每天对应的概率 输入期望值对话框。 或者这种情况之下,因为概率相同,你可以选择所有类别期望值相同。 输出结果 sig 值,也就是 P 值小于 0.05,拒绝原假设,说明现实中每天车祸放生的概率明显不同,我们知道这一结论之后,结合源数据,选择周二出行可能是比较保 险的。然而现实中,我们可能必须每天都要出去,所以时刻注意安全才是保障 险的。然而现实中,我们可能必须每天都要出去,所以时刻注意安全才是保障 啊!祝各位一生平安! 三、卡方独立性检验 独立性检验是检验两个变量之间是否独立的检验。通常的源数据格式为 excel 透视表的形式如: 本例检验不同员工喜欢的保险方案是否显著不同,把数据录入 SPSS 中: 注意录入数据时,每个单元格表示一个变量信息,要做数据分析,必须保证数 据存储的格式是正确的。 接下来需要做加权处理,把人数进行加权 至于为什么要做加权,因为我们后边在做交叉表分析时,人数这个变量不会被 至于为什么要做加权,因为我们后边在做交叉表分析时,人数这个变量不会被 选入,这样人数就不能跟随它的类别进入了,因此要加权。 接下来做交叉表分析,里面会有卡方检验的过程: 将两个分类变量分别选入行和列对话框 点击统计量,选中卡方统计量 点击继续后,点击确定得到输出结果 可以看到 可以看到 sig 大于 0.05,接受原假设,因此可以有 95%把握认为不同类型员工对保险方案的选择没有差别;但是如果考虑置信度为 0.1 的话,则 0.0880.1, 拒绝原假设,因此有 90%的把握认为不同类型的员工对保险方案的选择有差别!这里看你怎么选择置信度了!

文档评论(0)

tianya189 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档