卡方检验及其应用..docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卡方检验及其应用.

卡方检验及其应用 一、卡方检验概述: 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(fo)与理论次数(fe),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当fe越大,。显然fo与fe相差越大,卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。5,处理方法有以下四种:1、单元格合并法;2、增加样本数;3、去除样本法;4、使用校正公式。当某一期望次数小于5时,应该利用校正公式计算卡方值。公式为: 二、卡方检验的统计原理: 卡方检验所检测的是样本观察次数﹙或百分比﹚与理论或总体次数﹙或百分比﹚的差异性。 理论或总体的分布状况,可用统计的期望值(理论值)来体现。 卡方的统计原理,是取观察值与期望值相比较。卡方值越大,代表统计量与理论值的差异越大,一旦卡方值大于某一个临界值,即可获得显著的统计结论。 三、卡方检验的主要应用: 1、独立性检验 独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。如果两变量无关联即相互独立,说明对于其中一个变量而言,另一变量多项分类次数上的变化是在无差范围之内;如果两变量有关联即不独立,说明二者之间有交互作用存在。 独立性检验一般采用列联表的形式记录观察数据, 列联表是由两个以上的变量进行交叉分类的频数分布表,是用于提供基本调查结果的最常用形式,可以清楚地表示定类变量之间是否相互关联。1)四格表的检验2*2列联表的卡方检验四格表资料的检验用于进行两个率或两个构成比的比较。 专用公式: 若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1) 应用条件: 要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,,当样本含量小于40时只能用确切概率法计算概率。2)、行列表资料的检验R*C列联表的卡方检验行列表资料的检验用于多个率或多个构成比的比较。 专用公式: r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1] b) 应用条件: 要求每个格子中的理论频数T均大于5或1T5的格子数不超过总格子数的1/5。当有T1或1T5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行列表资料卡方检验的应用条件。多个率的两两比较可采用行列表分割的办法。 公式中,fxi表示横行各组实际频数的总和; fyi表示纵列各组实际频数的总和; N表示样本容量的总和; 例1:为了解男女在公共场所禁烟上的态度,随机调查100名男性和80名女性。男性中有58人赞成禁烟,42人不赞成;而女性中则有61人赞成,19人不赞成。那么,男女在公共场所禁烟的问题所持态度不同? 赞成 不赞成 行总和 男性 fo11 =58 fo12 =42 R1=100 女性 fo21 =62 fo22 =18 R2=80 列总和 C1=120 C2=60 T=180 解:(1)提出零假设Ho:   (2)确定自由度为(-1)×(2-1)=1,选择显著水平α=0.05。 (3)求解男女对的期望,这里采用所在行列的合计值的乘除以总计值来计算每一个期望值 赞成 不赞成 行总和 男性 fo11 =58 fo12 =42 R1=100 Fe11 =66.7 Fe12 =33.3 女性 fo21 =62 fo22 =18 R2=80 Fe21 =53.3 Fe22 =26.7 列总和 C1=120 C2=60 T=180 拒绝零假设,即男女对公共场所禁烟的态度有显著差异。 例2:某机构欲了解现在性别与收入是否有关,他们随机抽样500人,询问对此的看法,结果分为“有关、无关、不好说,,三种答案 有关 无关 不知道 合计 男 120 60 50 260 女 100 110 60 240 合计 220 170 110 500 解:(1)零假设Ho:性别与收入无关。   (2)确定自由度为(3-1)×(2-1)=2,选择显著水平α=0.05。 (3)利用卡方统计量计算公式计算统计量 故拒绝零假设。卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本

文档评论(0)

sfkl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档