拟合优度卡方检验.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在前面的课程中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题 . 然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设 . 例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下: 战争次数X 0 1 2 3 4 223 142 48 15 4 发生 X次战争的年数 在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述 . 也就是说,我们可以假设每年爆发战争次数分布X近似泊松分布. 上面的数据能否证实X 具有 泊松分布的假设是正确的? 现在的问题是: 又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来. 问该厂生产的钟的误差是否服从正态 分布? 再如,某工厂制造一批骰子,声称它是均匀的. 为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距. 也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6. 得到的数据能否说明“骰子均匀”的假设是可信的? 问题是: K.皮尔逊 这是一项很重要的工作,不少人把它视为近代统计学的开端. 解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓 检验法. 检验法是在总体X 的分布未知时, 根据来自总体的样本,检验关于总体分布的假设的一种检验方法. H0:总体X的分布函数为F(x) 然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设. 使用 对总体分布进行检验时, 我们先提出原假设: 检验法 这种检验通常称作拟合优度检验,它是一种非参数检验. 在用 检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验. 检验法 分布拟合的 的基本原理和步 骤如下: 检验法 3.根据所假设的理论分布,可以算出总体X的值落入每个Ai的概率pi,于是npi就是落入Ai的样本值的理论频数. 1. 将总体X的取值范围分成k个互不重迭的小区间,记作A1, A2, …, Ak . 2.把落入第i个小区间Ai的样本值的个数记作fi , 称为实测频数. 所有实测频数之和 f1+ f2+ …+ fk等于样本容量n. 标志着经验分布与理论分布之间的差异的大小. 皮尔逊引进如下统计量表示经验分布 与理论分布之间的差异: 统计量 的分布是什么? 在理论分布 已知的条件下, npi是常量 实测频数 理论频数 皮尔逊证明了如下定理: 若原假设中的理论分布F(x)已经完全给定,那么当 时,统计量 的分布渐近(k-1)个自由度的 分布. 如果理论分布F(x)中有r个未知参数需用相应的估计量来代替,那么当 时,统计量 的分布渐近 (k-r-1)个自由度的 分布. 为了便于理解,我们对定理作一点直观的说明. 是k个近似正态的变量的平方和. 这些变量之间存在着一个制约关系: 故统计量 渐近(k-1)个自由度的 分布. 在理论分布F(x)完全给定的情况下,每个pi 都是确定的常数. 由棣莫佛-拉普拉斯中心极限定理,当n充分大时,实测频数 fi 渐近正态, 因此 在F(x)尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个. 若有r个未知参数需用相应的估计量来代替,自由度就减少r个. 此时统计量 渐近(k-r-1)个自由度的 分布. 如果根据所给的样本值 X1,X2, …,Xn算得统计量 的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设. 得拒绝域: (不需估计参数) (估计r 个参数) 查 分布表可得临界值 ,使得 根据这个定理,对给定的显著性水平 , 皮尔逊定理是在n无限增大时推导出来的,因而在使用时要注意n要足够大,以及npi 不太小这两个条件. 根据计算实践,要求n不小于50,以及npi 都不小于 5. 否则应适当合并区间,使n

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档