张文彤-SPSS-第12节-卡方分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卡方检验--两个定性变量之间的关系成组的χ2检验是用途很广的一种假设检验方法,主要用于分类资料统计推断,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等它最基本的无效假设是:H0:观察频数与期望频数没有差别其原理为考察基于H0的理论频数分布和实际频数分布间的差异大小,据此求出相应的P值。例在CCSS的分析报告中,所有受访家庭会按照家庭年收入被分为低收入家庭和中高收入家庭两类,现希望考察不同收入级别的家庭其轿车拥有率是否相同。方法原理理论频数基于H0成立,两样本所在总体无差别的前提下计算出各单元格的理论频数来在该例中,我们做出描述统计分析,发现低收入家庭中335户中有32户拥有轿车,所占比为9.6%;高收入家庭中654户中有255户拥有轿车所占比为34.5%。那么问题来了,这种差距是抽样误差造成的呢?还是这两群体所拥有的轿车确是不一样的?为了解决这一问题,我们通过卡方检验来验证。H0:造成两个群体轿车拥有率的不同是抽样误差(观察频数与期望频数没有差异)首先,先假设H0成立——然后检验相应的“单元格”的频数方法原理残差设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差被称为残差残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度另一方面,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。这就是我们所说的卡方统计量,在1900年由英国统计学家Pearson首次提出,其公式为:方法原理从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0;观察频数与期望频数越接近,两者之间的差异越小,卡方值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。当然,卡方值的大小也和自由度有关卡方分布 显然,卡方值的大小不仅与A、E之差有关,还与单元格数(自由度)有关Spss中的操作操作:分析——描述性统计——交叉表——(将分类变量选入行,将因变量选入列。在单元格中选择“观察值、期望值、残差中的为标准化”;在统计量中选择卡方)表格解读:第二张表格,低收入组中轿车拥有的期望值为87.1(与实际存在差异),高收入组中轿车拥有的期望值为169.9(与实际存在差异)期望值怎么来?低收入家庭的轿车拥有期望值=低收入家庭总数x总的轿车拥有率(实际值或叫观察值=32,期望值=87.1)同理低收入家庭的轿车拥有期望值=高收入家庭总数x总的轿车拥有率期望值—实际值=残差(残差可表示一个类别观察值和理论值得偏离程度)(个人收获:当只是知道描述统计时我们不能轻易下结论,要通过推断统计来得出结论也就是说,当只看到表明现象时不要轻易下结论,下结论要有根据,科学研究的严谨在此体现)输出结果分析第1行:Pearson卡方卡方值为71.134a,自由度为1,p值为0.000由卡方检验表的p值推断,拒绝H0接受H1,认为在两类家庭中轿车拥有率是存在显著差异,又由描述统计得出,高收入家庭的轿车拥有率更高。第2行:连续校正四格表卡方值的校正上图中上标a:0个单元格(0.00%)具有的预期计数少于5,最小预期计数为87.05对上标a的解读:此为卡方检验的适用条件分析。统计学家Yates认为,卡方分布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的卡方值英国的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5)需要校正的条件若n 40 ,此时有 1 T 5时,需计算Yates连续性校正卡方值T 1,或n40时,应改用Fisher确切概率法直接计算概率图卡方检验第2行为连续校正值在用时,首先要看a.有没有单元格的(0.00%)的期望值少于5,如果有1-5之间的需要看连续性校正。b.连续型校正只针对2x2的表格第3行:Fisher的精确检验当校正行不通时就得看Fisher的精确分析,直接输出概率值。如何阅读卡方检验结果?教科书的看法当n≥40且所有T≥5时(T为理论频数),用普通的卡方检验,若所得P约等于Alpha,改用确切概率法;当n≥40但有1≤T5时,用校正的卡方检验;当n40或有T1时,不能用卡方检验,改用确切概率法。实际的做法一律向下看齐(直接看确切概率法)配对卡方检验分析实例某公司期望扩展业务,增开几家分店,但对开店地址不太确定。于是选了20个地址,请两位资深顾问分别对20个地址作了一个评价,把它们评为好、中、差三个等级,以便确定应对哪些地址进行更进一步调查,那么这两位资深顾问的评

文档评论(0)

gangshou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档