方差分析和回归分析.DOC

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学学院教师讲稿 第八章 PAGE 1 - 第八章 方差分析和回归分析 在生产过程和科学实验中,经常遇到这样的问题:影响产品的质量、产量的因素很多,我们需要通过观察或试验来判断哪些因素对产品的质量、产量有显著的影响,方差分析就是用来解决这类问题的一种有效方法。方差分析就是检验同方差的若干正态母体均值是否相等的一种统计分析方法,它是在20世纪20年代由英国统计学家费希尔首先用到农业试验上去的。后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面. 第一节 单因素的方差分析 在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素。因素分为两类,一类是人们可以控制的;一类是人们不可以控制的。以下我们所说的因素是可控因素,因素所处的状态称为该因素的水平。如果在一项试验中只有一个因素在改变,这样的试验我们称为单因素试验,如果多于一个因素在改变,就称为多因素试验。 本节就通过实例来讨论单因素试验。 1.数学模型 例9.1 某试验室对钢锭模进行选材试验。其方法是将试件加热到700°C,投入到20°C的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好。试验结果如表所示。 试验号 材质分类 A 1 2 3 4 5 6 7 8 160 161 165 168 170 172 180 158 164 164 170 175 146 155 160 162 164 166 174 182 151 152 153 157 160 168 试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异。 这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4种不同的材质表示钢锭模的4个水平,这项试验叫做4个水平单因素试验。 例9.2 考察一种人造纤维在不同温度的水中浸泡后的缩水率,在40°C,50°C,…,90°C的水中分别进行4次试验,得到该种纤维在每次试验中的缩水率如表。试问浸泡水的温度对缩水率有无显著影响? 试验号 温度 40 50 60 70 80 90 1 2 3 4 4.3 7.8 3.2 6.5 6.1 7.3 4.2 4.1 10.0 4.8 5.4 9.6 6.5 8.3 8.6 8.2 9.3 8.7 7.2 10.1 9.5 8.8 11.4 7.8 这里试验指标是人造纤维的缩水率,温度是因素,这项试验为6水平单因素试验。 单因素实验的一般数学模型:因素A有s个水平A,A,…………,,在水平(j=1,2,…,s)下进行次独立试验,得到如下表的结果。 水平 观测值 A … 样本总和 样本均值 总体均值 … … … … … … … … … … 假定:各水平(j=1,2,…,s)下的样本~N(,) i=1,2, …, ,j=1,2,…,s,且相互独立。 (分组总体) 故可看作是随机误差,它们是试验中无法控制的各种因素引起的。记则 , i=1,2, …, ,j=1,2,…,s ~N(0,),各相互独立 (9-1) 其中与均为未知参数。(9-1)式称为单因素试验方差分析。方差分析的任务是对于模型(9-1),检验s个总体N(,),…,N(,)的均值是否相等,即检验假设 : : 不全相等 (9-2) 引入 =,其中,表示的加权平均,称为总平均。 表示水平下的总体平均值和总平均的差异 ,习惯上将称为水平的效应。则模型(9-1)可改写为: 可分解总平均、水平的效应及随机误差3部分之和 =0,~N(0,),各独立,i=1,2, …, ,j=1,2,…,s 假设(9-2)等价于假设 : : 不全为零 2.平方和分解 记 = 这里,能反映全部试验数据的差异,又称为总变差。 下的样本均值 由于 = = 而 记=,,称误差平方和,称因素A的效应平方和,于是 =+ 记,为随机误差的总平均, 于是= = 注:①反映了实验过程中各种随机因素所引起的随机误差。 ②反映了各组样本之间的差异程度,即由于因素A的不同水平所引起的系统误差。 ③方差分析的目的是研究相对于有多大,若比显著地大,这表明各水平对指标的影响有显著差异,故需研究与有关的统计量。 3.假设检验问题 当成立时,设~N(,) i=1,2, …, ,j=1,2,…,s,且相互独立,则有 , 于是,对于给定的显著性水平,由于 由此得检验问题的拒绝域 由样本值计算F的值,若,则拒绝,即认为水平的改变对指标有显著性的影响;若,则接受原假设,即

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档