浙江大学统计学第六讲卡方检验.pptVIP

浙江大学统计学第六讲卡方检验.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章x检验 x检验(chi- square test)是一种用途较广的假设检验方 法。本章重点介绍它用于频数分布资料拟合优度检验和分类 资料的假设检验 第一节x分布 桥布是一种连续型分布,可用于检验资料的实际频数和 按检验假设计算的理论频数是否相符等问题。早在1875年, F. Helmet即得出来自正态总体的样本方差的分布服从x分布。 1900年,K. Pearson也独立地从检验分布的拟合优度发现这 相同的x2分布。 ⅴ个相互独立的标准正态变量u.(i=1,2,…,v)的平方和称 为筏变量,即 x =u,+u2 l 它的分布即为x2分布,其自由度为v。式中X为服从正态分 布的变量,卩为总体均数,σ为总体标准差 在实际应用时,资料中k个实际频数A与相应的理论频数T之 间差别的大小,可用式(6-2)表示。如果样本含量n足够大 (大于40),且各T都大于5,则式(6-2)近似于x-分布。n 愈大,近似程度愈好 i=1,2,…,k 分布函数及其图形 x2分布的密度函数为 f(x2) x 0≤x∞,v=1,2,3,…。 2T 式中是r()伽玛( gamma)函数在v2处的函数值。 这样,已知v时,就能按式(6-3)绘出x2分布曲线,如图6- 。x2分布的分布函数为 F(x2)2= 0≤X v=1,2,3,…。 (6-4) 2I(-) 它的几何意义是:x分布曲线下从0到某给定x2值的面 积,如图6-l。 分布的分位数 当v确定后,x分布曲线下右侧尾部的面积P为指定值c时 横轴上相应的界值x2,记作xam,如图61,这就是x2分布的 分位数,此值有x2界值表,即附表3。作x2检验时,先求得 观察样本的统计量x值,然后按v由附表3査得x2界值,与统 计量比较得到与统计量相应的P值 图64不同自由度的x2分布曲缓图 三、x分布与正态分布的关系 1.从图6可见,当v逐渐增大时,x2曲线逼近于正态曲线, 这时它们的分布函数有如下关系 f(xdx2≈Φ (6-5 式中的自由度v恰好等于x分布的均数,2v等于它的方差 2.当v=1时,由式(6-1)可知,x变量等于标准正态变量的 平方,因此xa等于标准正态分布的双侧分位数u之平方和。例 如 196,而=3.84=(1.96)2 四、x分布的应用 1.直接应用:用于检验某一分布的实际频数与理论频数是否符 合;某些统计量的分布可用x2分布作近似处理,如各组含量 不小于5,且组数不小于3时,秩和检验统计量H的分布可近似 地用x2分布来代替:正态总体方差的区间估计等。 2间接应用:如分布和F分布就是在x2分布的基础上推导出 来的。 第二节拟合优度检验 拟合优度检验是判断样本实际频数分布与拟合的理论频数分布 是否符合,或者说判断此样本是否来自某种分布。本节以正态分布 的拟合优度检验为例,说明该方法的步骤,具体步骤如下: 建立检验假设,确定检验水准 H:实际频数与正态分布的理论频数符合 H1:实际频数与正态分布的理论频数不符合 a=0.05或a=0.10 2按式(66)计算统计量x2值 f-F F 式中f为各组段的实际频数J为由拟合曲线算得的各组段的理论 频数,k为用式(6-6)计算x2值时所用F的个数,由于计算F 时,用了n、ⅹ、S三个统计量,故v=k-3。当总体参数μ及σ 已知时,则v=k-1。 然后由u值附表1得φ(u),它的意义是正态曲线下由-∞至 的面积。相邻两Φ(u)之差值δ为各组段的相对频率,乘以n化 为理论频数F 注意ΣF应与∑f相等或很相近,否则计算有误。求x2值时 般要求F不宜过小,比如不小于5。因此常将F值小的相邻组合 并,相应的f亦合并。 3.确定概率P并作出统计推论。 例61某医学院校医随机抽取100名一年级医学生,测定空腹血 糖值(mmol/L),其频数分布如表6-1(教材62页)中第(1)栏 和第(2)栏所示,试用x2检验判断该资料是否符合正态分布。 (1)建立检验假设和确定检验水准 H:一年级大学生空腹血糖的实际频数与正态分布的理论频数 符合 H1:一年级大学生空腹血糖的实际频数与正态分布的理论频数 不符合 检验水准为a=0.10。 本资料的均数ⅹ=41966,S=0.6737。 表6-1中第(3)列为各组段上下限处的u值,如第1组段的上限对 应的u=-1.85;

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档