[理学]09卡方检验.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]09卡方检验

第九讲:卡方检验 卡方分布(chi-square distribution)* 1875年,F. Helmet得出:来自正态总体的样本方差的分布服从卡方分布: 1900年K. Pearson又从检验分布的拟合优度(goodness of fit)中也发现了这一相同的卡方分布,可用于检验资料的实际频数和理论频数是否相符等问题: 卡方分布* 设随机变量Z1,Z2,…Zk,相互独立,且都服从标准正态分布N (0,1)。那么,我们将k个独立标准正态变量的平方和称为卡方变量,它满足自由度为k的卡方分布,记为: 卡方分布图形特征* 卡方分布图形特征* 卡方分布的形状依赖于自由度ν 的大小: 当自由度ν≤2时,曲线呈“L”型; 随着ν 的增加,曲线逐渐趋于对称; 当自由度ν →∞时,曲线逼近于正态曲线 卡方分布的曲线下面积定义 当ν 确定后,卡方分布曲线下右侧尾部的面积为a时,横轴上相应的卡方值,记为c2a,n,如下图;实际应用时,可根据ν 由附表8查得 如果c2 c2a,n,曲线下面积小于a;反之则大于a Karl. Pearson Carl Pearson or Karl Pearson (1857-1936) Journal Biometrika Pearson product-moment correlation coefficient、Linear regression and correlation、Pearsons chi-square test 卡方检验(chi-square test) χ2检验是现代统计学的创始人之一,英国人Karl . Pearson于1900年提出的一种具有广泛用途的统计方法 可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等 卡方检验的基本思想 医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分为两组,分别用两种药物资料,结果见下表,问两种药物的疗效是否不同? 卡方检验的基本思想 从表中可见两疗法的有效率不相同,那么这种差别究竟是由于抽样误差还是由于药物疗效的确有差别? 不妨假设两药物的疗效是相同的,那么此时两种药物的疗效之差仅仅来源于抽样误差,我们可以使用前面介绍的二项分布的两个大样本率比较的Z检验分析 还可以考虑使用本章节介绍的卡方检验分析 卡方检验的基本思想 既然假设两药的总体疗效相同,可以考虑将两组样本资料合并,计算一个“合计率”,作为总体率的估计 两药的合计有效率Pc=65/80=81.25% 在此合计有效率的情况下,资料45例患者应该有Pc×45=36.5625例有效,(1-Pc)×45 =8.4375例无效;同理如果资料35例患者,应该有28.4375例有效,6.5625例无效 将上述数据称为疗效的理论数,列表如下: 卡方检验的基本思想 卡方检验的基本思想 从表中可见,疗效的理论数(根据假设两总体疗效相同得到)与实际人数存在差别 如果我们的假设成立的话,这种差别属于抽样误差,应该不会很大;反之,如果这种差别很悬殊,则因该怀疑原假设不成立 如何评价“悬殊”与“不悬殊”? 使用卡方检验 卡方检验的基本思想 卡方检验基本公式: 如果假设成立,实际数与理论数的差距应该较小,按照上式计算的卡方值因该接近0,如果卡方值远离0则应该拒绝原假设 卡方值满足卡方分布,求得相应卡方值的曲线下面积就可以得到P值,进而作结论 可见卡方检验的基本原理就是分析实际频数与根据假设构建的理论频数间的吻合程度(拟合度) 一、拟合优度检验 (goodness of fit test) 拟合优度检验旨在根据样本的频数分布检验其总体分布是否等于某给定的理论分布 例如:能否判断120个男童身高满足正态分布(例9-1)? 解答思路:假设身高满足正态,依据正态分布估计不同身高区间对应的理论人数,与实际观察人数比较,计算卡方统计量,如果卡方值较大则拒绝原假设 拟合优度检验 H0:总体分布为均数为139.48,标准差为7.30的 正态分布 H1:总体分布不为该正态分布 a=0.05 因为卡方分布原为连续性分布,Pearson推导卡方检验公式是对卡方的近似(分类变量的取值并不是连续的),其使用条件中规定理论数不得小于5,因此我们将T小于5的组段与附近组段的理论数合并;依据卡方检验公式:c2=∑(A-T)2/T计算卡方值为5.9184 拟合优度检验 自由度v=实际频数个数k-1-计算理论数时所需要的参数个数m;本题中,在计算理论频数时用到了正态分布的均数与标准差,所以m=2(例如在二项分布的拟合优度检验时,使用到的参数为二项分布的总体率p;而在泊松分布的拟合优度检验时,使用到了泊松分布的总体均数l) 故本题的自由度为7-1-2=4,查表得c20.05,4=9.4

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档