- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二十二讲 分布拟合检验 T H 正面55次 反面45次 掷一枚均匀硬币100次, 问这枚硬币是否均匀? 提出假设 其中p为正面出现的概率. 取统计量 近似N(0,1) 为正面出现的频率. 由中心极限定理 先算出统计量U的实测值 我们来计算检验的p值. p=P{|U|1} 检验的p值是: =2-2(0.8413)=0.3174 =2-2 (1) =1-P{|U|≤1} 若给定显著性水平 0.3174, U的实测值就不落入拒绝域, 此时不能拒绝H0. * * 概率论与数理统计 分布拟合检验 检验的 p 值 例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下: 战争次数X 0 1 2 3 4 223 142 48 15 4 发生 X次战争的年数 总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设 . 一、分布拟合检验 根据泊松分布产生的一般条件,每年爆发战争的次数,可以用一个泊松随机变量来近似描述 . 即我们可以假设每年爆发战争次数X近似泊松分布. 上面的数据能否证实X 具有泊松分布的假设是正确的? 问题: 又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来. 问该厂生产的钟的误差是否服从正态分布? 再如,某工厂制造一批骰子,声称它是均匀的. 为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距. 也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6. 得到的数据能否说明“骰子均匀”的假设是可信的? 问题是: K.皮尔逊 人们把它视为近代统计学的开端. 解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓 检验法. 检验法是在总体X 的分布未知时, 根据来自总体的样本,检验关于总体分布的假设的一种检验方法. H0:总体X的分布函数为F(x) 在F(x)不含未知参数时,可根据样本的经验分布与所假设的理论分布之间的吻合程度来决定是否接受原假设. 我们先提出原假设: 使用 对总体分布进行检验时, 检验法 在检验假设H0时,若在H0下分布类型已知,但含参数未知,这时需要先用极大似然估计法估计参数,然后作检验. (分布律、密度函数) 3.根据所假设的理论分布,当假设H0为真时,可以算出总体X的值落入每个Ai的概率pi = P(Ai) 1. 将总体X的取值范围分成k个互不重迭的小区间,记作A1, A2, …, Ak . 2.把落入第i个小区间Ai的样本观察值的个数记作fi , f i /n 为n次试验中Ai 发生的频率. 而 f 1+ f 2+ …+ f k 等于样本容量 n. 在F(x)不含未知参数时, 的基本步骤如下: 检验法 标志着经验分布与理论分布之间的差异的大小. 统计量 的分布是什么? 在理论分布 已知的条件下, npi是常量 实测频率 理论概率 皮尔逊取 引进如下检验统计量: 皮尔逊证明了如下定理: 近似服从自由度为k-1的 分布. 如果理论分布F(x)中有 r 个未知参数,需用相应的估计量来代替,那么当 时,统计量 的分布渐近自由度为k-r-1的 分布. 若n充分大( ),则当F(x)不含参数,H0为真时,统计量 是k个近似正态的变量的平方和. 这些变量之间存在着一个制约关系: 故统计量 渐近(k-1)个自由度的 分布. 在理论分布F(x)完全给定的情况下,每个pi 都是确定的常数. 由棣莫佛-拉普拉斯中心极限定理,当n充分大时, fi 渐近正态, 因此 在F(x)尚未完全给定的情况下 每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个. 若有 r 个未知参数需用相应的估计量来代替,自由度就减少r个. 此时统计量 渐近(k-r-1)个自由度的 分布. 如果根据所给的样本值 X1,X2,
文档评论(0)