方差分析与正交设计C6文档.doc

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
方差分析与正交设计C6文档

第五章 方差分析与正交设计 §1.单因素方差分析 在实际问题中,人们常常需要在不同的条件或不同的状态下,对所研究的对象进行对比试验,从而得到若干组数据(样本)。方差分析就是一种分析、处理多组试验数据均值间差异显著性的统计分析方法。其主要任务是通过对数据的分析处理,搞清各试验条件以及它们所处的状态对试验结果(又称试验指标)的影响,以便有效地指导实践,提高经济效益或科研水平。 1.1 基本概念 例1 某灯泡厂用四种不同材料的灯丝生产了四批灯泡,除灯丝材料不同外,其他生产条件完全相同。今由每批灯泡中随机地抽取若干个灯泡,测得使用寿命(单位:h)数据如表(1)所示,现在要求推断出灯泡使用寿命是否因灯丝材料不同而有显著差异。 表(1) 灯泡 寿命 灯丝 1 2 3 4 5 6 7 8 A1 A2 A3 A4 1600 1500 1640 1510 1610 1640 1550 1520 1650 1400 1600 1530 1680 1700 1620 1570 1700 1750 1640 1640 1700 1600 1680 1780 1740 1800 如果在一项试验中,只有一个因素变化,其他因素保持不变,我们称这种试验为单因素试验。因素所处的状态称为水平。 本例考虑的是一个因素即灯丝,这个因素具有四个水平,即四个不同材料的灯丝,A1, A2, A3, A4。 从表中的数据看到,即使对于同一种材料的灯丝,虽然生产条件都一样,但灯泡的使用寿命还是可以不相等的,这说明灯泡的使用寿命是一随机变量。现在用,,,表示四种材料的灯丝所生产的灯泡的使用寿命,这样就有四个总体。若从这四个总体中分别随机地抽取容量为的样本,,…,, 1,2,3,4,我们应用这四个样本来推断四个总体之间有无显著差异。要判断不同灯丝材料的灯泡对使用寿命的影响问题,就是要辨别使用寿命之间的差异是主要由抽样误差造成的还是由灯丝材料不同造成的。这一问题可以归结为判断四个总体是否具有相同的分布。另外,在方差分析中,总是假定各总体相互独立,且都服从正态分布。由于除因素外,试验的其他条件都认为相同,这样就可以假设每个总体的方差相同。因此推断四个总体是否具有相同分布的问题,就归结为检验四个具有相同方差的正态总体,其均值是否相等的问题。实际上,方差分析就是检验若干个具有相同方差相互独立的正态总体,它们的均值是否相等的一种统计分析方法。 前几章中我们曾介绍了检验两个正态总体均值间差异显著性的检验法。现在对多个正态总体,我们能否仍用检验法两两进行检验呢?结论是否定的。设想有十组数据,客观上它们来自同一正态总体,因而有相同的均值。在这种情况下,任取两组数据采用检验法检验其均值是否相等。设=0.05,则接受假设认为两组均值相等的概率为1—=0.95。但从十组数据中任取两组,共有=45种不同的取法,所以接受的概率为(0.95)45≈0.099。 客观上十组数据均值相等,而采用检验法两两检验时,犯第一类错误(认为至少有两组均值不等)的概率为0.901。由此可见,当组数增多时,采用检验法两两检验时,犯第一类错误的概率将大大增加,使我们判断的结果很不可靠。 波兰数学家R.A.Fisher(1923)提出的方差分析法,可同时判断多组数据均值间差异的显著性。 下面给出单因数方差分析的一般概念。 设有个相互独立的正态总体, 1,2,…, , ~。 设,,…,是从第个总体中抽取的容量为的简单随机样本。 由于~(1,2,…, ;1,2,…, ),与的差—可以看成是一个随机误差。因此满足 =+, (1) 而~,且互相独立,其中1,2,…, ;1,2,…, 。要求检验假设 ∶== … =。 1.2 统计分析 下面构造检验假设∶== … =用的统计量。记 , =。 (2) 这是第个总体的样本均值,也叫做组平均值。称 == (3) 为总平均值。是从个总体抽得的样本的总容量。由(2),(3)两式可得 =0。 由此得到 == ==+。 (4) 其中 =,=。 是所有观察资料与总平均值的差的平方和,称为总偏差平方和。它是描述所得全部数据离散程度的一个指标。由上式知,总偏差平方和可以分解为、两项之和。 我们再来看、的意义。记 (5) 是各均值的平均,叫做均值的总平均。令 =—,1,2,…, 。 它是各总

文档评论(0)

seunk + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档