数理统计三假设检验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数理统计三假设检验

诸点在一直线周围,这时认为点P 所对应出数据点可能是异常点。此 时,往往进一步找其他证据进行判 定。比如,检查原始试验的数据记 录,看是否有录入错误等。 如果图形分为比较明显的两个部分 如图3.6(b)的形状,那么,可能意 味着总体的分布是混合的。 二、 Pearsonχ2 检验 前面的图示法直观易行,但不能 从数量上反映样本与给定分布拟 合的程 度,这在许多情形下不能 满足需要。Karl Pearson于1900 年提出来一个衡量样本与给定分 布的拟合程度的量,这就是为后 人所熟知的Pearsonχ2 检验统计 量。我们将叙述χ2检验的基本思 想和结论。 1、Peareon χ2统计量:有限值 离散分布 首先,考虑一个特殊分布的拟 合优度检验问题。设X1,…,Xn为来 自于离散分布: 简单随机样本,要检验的问题是: 根据大数定律,当样本量充分大时, 一个随机事件发生的概率与频率应当 接近,于是,用随机事件{X=xi}的频 率与原假设中相应概率之间的差异来 检验上述假设。 记样本中xi出现的次数为Ni,且 Ni={Xi=xi}# , 定义χ2统计量: 则χ2为在各个xi处频率与假设的 概率差异平方(也可以说是观测频 数与原假设下的理论频数差异平 方)的加权和,它衡量了样本与假 设分布之间的似合的程度,称之 为Pearsonχ2统计量,它是由Karl Pearson提出的。显然,当 H0不成 立时,χ2统计量将有偏大的趋势。 关于它的分布,首先注意到(N1,…, NM)服从多项分布, 当原假设成立 时,该多项分布为: 其中,非负整数n1,…,nM满足: 在此基础上,可以证明下列定理 定理2:在原假设H0下, 2、 Pearson χ2检验:一般分布 现在考虑一般分布的拟合优度 检验问题。Pearson采用了如下 方法: (1)将总体X的取值范围 分成 M个子集Ei(i=1,…,M),满足: (2)根据原假设的分布F0,计算 第六节 拟合优度检验 本节讨论的拟合优度检验,是 用来检验样本与某 个分布或分布 族的拟合是否有显著差异的统计 方法。显然,拟合优度检验在 统 计数据分析中占有非常重要的地 位,它是建立统计模型的基本步 骤之一。 拟合优度检验的基本思路是寻 求某种衡量样本的分布特性与猜 测的统计模型之间的差异的量。 简单地说,就是寻求衡量数据与 模型的拟合程度的量。当表示差 异的量超过某个界限,便认为总 体与这个统计模型之间差异太大,用这个模型来描述可能会引起 问题,产生误导的结论。由此可 以看出这确实是一个假设检验问 题;拟合优度检验的方法随着衡 量样本与统计模型之 间拟合程度 的量的不同而不同。 以下将主要介绍图示法、Pearson χ2检验法和EDF型检验,同时对于 正态分布的拟合优度检验进行更为 细致的讨论。 需要特别指出的是,由于问题本 身的性质,拟合优度检验基本上 属于大 样本理论问题,因为当样 本量很小时,样本中所包含的关 于分布特性:比如 分布密度的形 状)的信息一般不足以让我们做出 可靠的判断。 一、图示法 图示法是拟合优度检验的常用 方法,虽然不能定量地描述样本 与假设的 总体分布之间的差异, 但具有简便直观、易于解释的特 点,往往从中能够发 现样本或总 体的某些特征,从而为建立统计 模型提供更多的信息。本小节介 绍P–P散点图和Q–Q散点图两种 图方法。 1、P–P 散点图 设X1,?,Xn为来自于连续型分 布F的独立同分布样本,根据所 研究问题的实际背景,猜测F为 某连续型分布F0。我们的问题是 检验假设: 介绍P–P图方法,首先给出下面 的定理。 定理1:若上述检验的原假设成立 即 成立,则: 相互独立,并且服从分布 记 为 的顺序统计量,则由 顺序统计量的概率密度函数的公 式知 的概率密度函数为: 这种作图法实际上是检验 U1,U2,?,Un是否来自(0,l)上的均 匀分布U (0,1 )。当p – p散点图 不呈直线时,一般需要依据问题 的背景和样本的某些特性对于总 体的分布特点进行进一步的分析,同时也需要逐步积累数据分 析的经验。有下面几种典型情况: (1)Ui的均值是0.5,图形关于 (0.5,0.5)对称,而Ui的取值有向 0.5 集中的倾向。P–P散点图呈反 S型,如图3.3 (b)所示。此时,表 明函数 F0在由X1,X2,?,Xn标明的 范围内变化平缓,从而F0相对于 真正的总体分布 来说可能分散性 偏大,尾部较重;而对称性表明 二者的密度

文档评论(0)

woaitiantian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档