- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
24. 卡方检验
卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f0与理论频数fe(又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从分布,即
卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,值越小。
卡方检验要求:
(1)分类相互排斥,互不包容;
(2)观察值相互独立;
(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。
卡方校正公式为:
卡方检验的原假设H0: = 0; 备择假设H1: ≠0;
卡方检验的用途:
(1)检验某连续变量的数据是否服从某种分布(拟合优度检验);
(2)检验某分类变量各类的出现概率是否等于指定概率;
(3)检验两个分类变量是否相互独立(关联性检验);
(4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;
(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。
(一)检验单样本某水平概率是否等于某指定概率
一、单样本案例
例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。
有数据文件:
检验“性别”的男女比例是否相同(各占1/2)。
1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”
2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;
注意:变量“性别”的度量标准必须改为“名义”类型。
3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;
4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;
注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。
点【确定】回到原窗口,点【运行】得到
双击上表,得到更多的描述:
结果说明:
(1)男生的观察频数为28,理论频数为25,残差=3;女生的观察频数为22,理论频数为25,残差=-3;可以计算
卡方值=[32+(-3)2]/25=0.72
(2)卡方检验的P值=0.3960.05, 故接受原假设H0,即认为男女性别人数无差异。
注:卡方检验的P值是近似P值,若用“二项分布检验”计算出精确P值=0.480. 另外,上述卡方检验也可以用:【分析】——【非参数检验】——【旧对话框】——【卡方】
得到的结果是一致的。
二、两样本或多样本案例——比较不同类的构成比或发生率的差异
问题:两组收入不同的受访家庭其轿车拥有率的比较。
使用【交叉表】的卡方检验来实现,需要注意:若交叉表中存在有序分类变量,则适合用秩和检验而不是卡方检验。
有数据文件:
变量O1表示是否拥有轿车:“1=有,2=没有”;
变量Ts9表示收入级别:“1=4.8万以上,2=4.8万以上”。
1. 【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框,根据需要勾选“显示复式条形图”;
2. 点【统计量】,打开“统计量”子窗口,勾选“卡方”表示进行卡方检验;
3. 点【继续】回到原窗口,点【单元格】打开“单元显示”窗口,【计数】输出观察频数和理论频数,默认勾选“观察值”;【百分比】勾选“行”;【非整数权重】设置小数权重问题,保持默认;
注:“残差”设置残差的输出方式;“z-检验”对多于两组的数据做两两组间比较;
点【继续】回到原窗口,点【确定】得到
案例处理摘要
案例
有效的
缺失
合计
N
百分比
N
百分比
N
百分比
家庭收入2级 * O1. 是否拥有家用轿车
989
86.2%
158
13.8%
1147
100.0%
家庭收入2级* O1. 是否拥有家用轿车 交叉制表
O1. 是否拥有家用轿车
合计
有
没有
家庭收入2级
Below 48,000
计数
32
303
335
家庭收入2级 中的 %
9.6%
90.4%
100.0%
Over 48,000
计数
225
429
654
家庭收入2级 中的 %
34.4%
65.6%
100.0%
合计
计数
257
732
989
家庭收入2级 中的 %
26.0%
74.0%
100.0%
低收入家庭有9.6%拥有轿车;高收入家庭34.4%拥有轿车。
卡方检验
值
df
渐进 Sig. (双侧)
精确 Sig.(双侧)
精确 Sig.(单侧)
Pearson 卡方
71.134a
1
.000
连续校正b
69.848
1
.000
似
文档评论(0)