- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论打印
数学系10数本班 温纯 学号
8.1 方差分析
一、单因子方差分析
有时我们会遇到需要比较多个母体均值的问题,下面便是一个例子
例8.1 为寻求适应本地区的高产油菜品种,今选了5个不同品种,每一品种在4块试验田上试钟,得到在每一块田上的亩产量如下表
我们要研究的问题是诸不同品种的平均亩产量是否有显著差异
在这个问题中,我们遇到需要比较5个母体均值的问题.如果每一个母体的分布都是正态分布,并且各个母体的方差相等,那么比较各个母体均值是否一致的问题可以用方差分析方法来解决.
为方便起见,我们常称在试验中变化的因素为因子,用 表示,因子在试验中所取的不同状态称为水平,因子A的r个不同水平用 表示.从本章起,我们将不再总是用希腊字母 代表随机变量,用拉丁字母x,y,...代表随机变量所取的值.
在本例中只考虑品种这一因子(记为A)对亩产量的影响,5个不同品种就是该因子的5个不同水平(分别记为 ).由于同一品种在不同田块上的亩产量不同,我们可以认为一个品种的亩产量就是一个母体,在方差分析中总假定各母体独立地服从同方差的正态分布,即第i个品种的亩产量是一个随机变量,它服从分布 ,i=1,2,3,4,5.试验的目的就是要检验假设
是否成立.若拒绝 ,那么我们就认为这5个品种的平均亩产量之间有显著差异;反之,就认为各品种间产量的不同是由随机因素引起的.方差分析就是检验假设(8.1)的一种方法.
实际上,方差分析是检验同方差的若干正态母体均值是否相等的一种统计分析方法.
在实际问题中影响母体均值的因素可能不止一个.我们按试验中因子的个数,可以有单因子的个数,可以有单因子方差分析、二因子方差分析、多因子方差分析,然后再讨论单因子方差分析是类似的.例8.1是一个单因子方差分析问题.这里我们先讨论单因子方差分析,然后再讨论二因子方差分析问题.多因子方差分析与二因子方差分析是类似的,这里不再详述了.
设在某试验中,因子A有r个不同水平 ,在 水平下的试验结果 服从分布 ,且 间相互独立.现在 水平下做了t次试验,获得了t个实验结果 ,这可以看成是取自 的一个容量为t的子样,i=1,2,...,r.由于 ,故 与 的方差可以看成一个随机误差 .这样一来,可以假定 具有下述数据结构式:
其中诸 相互独立,均服从 分布,要检验的假设是
为了今后方便起见,把参数的形式改变一下,并记
称为一般平均, 为因子A的第i个水平的效应,容易看出,r个效应满足关系:
在这样的改变下,单因子方差分析的模型可以表示为:
所要检验的假设(8.3)可以写成:
为了导出检验假设(8.5)的统计量,我们首先分析一下什么是引起诸 波动的原因.这里有两个原因,一个是假设(8.5)为真时,诸 的波动纯粹是随机性引起的;另一个可能是假设(8.5)不真引起的.因而我们就想用一个量来刻画诸 之间的波动,并把引起波动的上述两个原因用另外两个量表示出来,这就是方差分析中常用的平方和分解的方法.下面我们就从平方和分解入手来导出检验(8.5)的统计量.
通常我们可以用 与样本总平均 之间的偏差平方和来反映 之间的波动.令
其中 称为 为总的偏差平方和.若令
则
其中交叉乘积项
若记
则
为一个平方和分解式.为了看清 的意义,我们利用数据结构式(8.4):
其中 的意义同 ,从而
反映了误差的波动,称它为误差的偏差平方和,而
在假设(8.5)为真时,它反映误差的波动;在假设(8.5)不真时,它就反映因子A的不同水平效应间的差异(当然也包含误差),称它为因子A的偏差平方和.
这样我们通过平方和分解式(8.9)把引起 波动的两个原因在数量上刻画了出来.如何来构造检验的统计量?这可以从 和 的数学期望得到启发.为此我们先求一下(8.7)和(8.8)的数学期望,利用(8.10),(8.11)有:
由(8.12)知, 为 的无偏估计,当假设(8.5)为真时, 也是 的无偏估计.故当假设(8.5)为真时,比值
不能太大,当F值过大时,可以认为假设(8.5)不真.以上仅是直观上的考虑,为了能使上述考虑可行,即用统计量(8.14)去检验假设(8.5),还必须知道在假设(8.5)为真时F的分布,这样才能得出检验的拒绝域.为了求出统计量F的分布,我们来研究平方和分解式(8.9)中的三个平方和 , 和 的分布.
在假设(8.5)为真时,一切 ,相互独立,故
另外由(8.10)及对 的假定,利
文档评论(0)