第09章资料分布的拟合优度检验.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第09章资料分布的拟合优度检验

第9章 资料分布的拟合优度检验 统计资料的分布是统计描述与统计推断的基础。统计资料是否服从某统计分布,或能否用某已知的分布或分布族拟合实际数据?拟合效果好坏的标准是什么?这就是资料分布拟合优度检验(goodness of fit test)要解决的问题。分布的拟合优度检验方法非常丰富,本章重点介绍两种有代表性的适用于各种分布的拟合优度检验方法,即Pearson (2检验及Kolmogorov检验。在9.3节介绍正态分布的矩法检验。 § 9.1 Pearson ( 2检验 在第7章介绍了用于率的比较和构成比比较的Pearson (2检验,其理论公式是: (9.1) 其中A表示实际频数,T表示理论频数。因此,Pearson (2检验实际上是用于实际频数与理论频数比较的一个检验统计量。实际频数与理论频数相差愈大,则(2值愈大,反之愈小。由此可见,Pearson (2检验可用于资料分布的拟合优度检验,统计量(2服从自由度为: ( =组数-1-s (9.2) 的(2分布。其中s为根据样本估计理论分布时所用参数的个数,这就是Fisher在1942年提出的“增加一个估计参数,就减少一个自由度”的原则。式(9.1)中要求理论频数大于5,但没有对理论分布形式提出要求,故Pearson(2检验适用于任意分布的拟合优度检验。 例9.1 (多项分布的拟合) ABO血型受控于A、B、O三个等位基因。据报道,汉族人的三个等位基因频率分别为:p=0.2019,q=0.2512和r=0.5469。则根据遗传学中Hardy-Weinberg平衡法则,估计得汉族人四种血型的理论频率为: O型: PO =r2=(0.5469)2=0.2991 A型: PA =p2+2pr=0.20192+2(0.2019(0.5469=0.2616 B型: PB =q2+2qr=0.25122+2(0.2512(0.5469=0.3379 AB型: PAB =2pq=2(0.2019(0.2512=0.1014 且PO+PA +PB+PAB =(p+q+r) 2=1。 今调查507名傣族人的ABO血型分布为:O型205人,A型112人,B型150人,AB型40人。问傣族人血型的分布与汉族人血型的分布是否相同? 血型的分布属多项分布。这里提出的问题是一个实际分布f与一个已知分布f0的比较。 H0:傣族人的血型分布与汉族人的血型分布相同; H1:傣族人的血型分布与汉族人的血型分布不同。 ( =0.20。 (1) 首先计算理论频数。本例中调查人数为507人,若按汉族人血型的理论频率估计,则O,A,B,AB四种血型的理论频数分别为:507(0.2991,507(0.2616,507(0.3379和507(0.1014。结果列于表9.1。 (2) 计算(2统计量。 表9.1 507名傣族人血型的实际频数f与按汉族人理论频率计算的理论频数f0 O A B AB 合计 f 205 112 150 40 507 f0 151.64 132.63 171.32 51.41 507.00 本例的理论分布是已知的,不是根据样本估计的,即估计分布所用参数个数为0。因此自由度为: (=4-1-0=3 现(2=27.1710,按自由度为3的(2分布判断,P0.0001,按( =0.20水准,拒绝H0,故不能认为傣族人的血型分布与汉族人相同。 例9.2 (二项分布的拟合) 当一个亲本为5对基因均杂合的杂合子,另一个亲本为5对基因的隐性纯合子时,则理论上,杂交后代的5对基因有一半为显性的,另一半为隐性的。今观察551只杂交后代的5对基因,结果如下。 表9.2 551只杂交后代的显性基因 显性基因的个数X (1) 观察频数f (2) 理论频数f0 (3) 0 17 17.2 1 81 86.1 2 152 172.2 3 180 172.2 4 104 86.1 5 17 17.2 合计 551 551.0 问该资料是否支持上述理论。 这是一个二项分布的拟合问题。理论显性率( =0.5,因此,这也是实际分布与已知理论分布的比较。 H0:显性基因的个数服从显性率为0.5的二项分布; H1:显性基因的个数不服从显性率为0.5的二项分布。 (=0.20。 (1) 计算理论频数。根据二项分布的计算公式,显性基因为x个时的理论频数为: 计算结果见表9.2第(3)栏。 (2) 计算(2统计量。 这里理论分布已知,故s=0。自

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档