第3章方差分析(精品课程).doc

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章方差分析(精品课程)

第三章方差分析(初稿) 3.1 单因素方差分析的数学模型 首先让我们看两个例子: 例3.1 设甲、乙、丙三块麦田的基本苗数(按面积大小抽取样本点数)得表3.1,问三块地的基本苗数是否有显著差别? 表3.1三块麦田的基本苗数 甲 乙 丙 21 20 24 29 25 22 24 25 28 22 23 25 25 29 21 30 31 26 27 24 . 26 26 . . 20 . . 21 . 例3.2为了研究淬火温度和等温温度对铣刀硬度的影响三 种不同淬火温度和三种等温温度淬火,测得铣刀平均硬度如表3.2,检验淬火温度及等温温度是否对硬度y有显著影响。 表3.2 淬火温度与等温温度对硬度的影响 淬火温度 等温温度 B1 B2 B3 A1 64 66 68 A2 66 68 67 A3 65 67 68 这两个例子和以前回归分析的问题不同.首先,它们都只考察某种因素(地块、淬火温度、等温温度)在一系列试验中对产品某个指标(寿命、得率)的影响是否显著,而不要求建立回归方程;其次,这些因素可以不是定量的(如地块),即或这些因素是定量(如淬火温度与等温温度)但其数值也不作为回归中变量的观察值,而只是代表一种处理(试验方案);最后,当因素确定后,可以作反复的试验。这两个例子和以前均值假设检验也不同,均值假设检验不考虑因素问题,而方差分析要考虑。 在许多科学研究中都遇到和这两个例子类似的问题。尤其是科学研究中常涉及许多因素,例如研究作物栽培时,要考虑播种期、品种、土质、施肥方式、灌溉方式对产量的影响;在化学反应中要观察原料成分、剂量、催化剂、温度、压力,搅拌速度等对得率的影响。这些因素中要选出影响大的,以进一步安排更细致的试验,而判断一个因素的影响“是否大”的主要方法就是方差分析。 我们所考察的。影响产品指标的因素(如产地,温度等)也称为因子,用大写字母A,B,C表示,例1有一个因子(地块),例2有2个因子(如淬火温度与等温温度)。因素所能处的状况,如甲、乙、丙;60,65,70,75,……,称为因子的水平,简称为水平。例1的因子有三个水平(甲、乙、丙),例2每个因子恰也有3个水平,水平常以表示。 因子也可以看成是一种变量,其取值不是数,而是水平。例如“产地”是一个变量,它取的值是“北京”、“上海”、“南京”等。这种变量称为属性变量,定性变量或分类变量.本节只讨论一个因子,即一个分类变量的方差分析——单因子方差分析。 方差分析的目的在于找出自变量与因变量之间的线性关系,或自变量对因变量的实验效果。这种实验效果可分为:主效果、交互效果、镶嵌效果。 Qualitative Variable(自变量,又称独立变量、定性变量),Classification Variable(分类变量,其数值多半是不连续的。Response Variable(因变量,又称反应变量,其数值则是连续的) 一般地,假设因素A有k个水平:。第j个水平做实验次,得指标y,的个数据。例3.1中。通常作如下假设: 同一个水平下得到的观测值,是由于实验过程中各种偶然因素的干扰及测量误差所致,每次实验中这些偶然因素的总和称为实验误差,它们是方差相同的零均值正态随机变量; 所有误差相互独立; 由于水平的不同,可能会给一个定量的确定性的影响,其大小是未知的。 于是我们建立单因子方差分析数学模型 (3.1) 其中相互独立,。(4.1)式称为单因素方差分析的数学模型。 判断这个因素的影响是否显著就是要检验假设: ,不全相等 令 ,, 容易证明是的最小二乘估计 作方差分解 并令 , 即: -----总的误差平方和 组内差,反映试验误差影响的大小。 ------组间差,反映因素A的各个水平不同引起的误差,若A的水平引起的误差显著时, 就比较大,反之就比较小。 则有: 分别称为组内差和组间差。组内差又称为误差,用以估计实验误差影响的大小;组间差反映因素A的水平不同引起的系统差异。若A的水平不同引起的系统差异(即组间的差距)显著时,SSA就比较大;反之,当A引起的系统差异不显著时,SSA就比较小.而SSE主要是由试验误差引起的。SSA由k个平方之和形成,但有一个恒等式约束,只有k-1个自由度;同理SSE有n-k个自由度。下列定理给出SSA/SSE的分布 定理: 对于所给的模型,若成立时, 则 如果F的值超过临界值(通常取为),就否定;当F超过时,就称为高度显著。当成立时,F的值不应太大,若F的值大于临界值时,就应否定,即认为间存在显著差异。 一般总用方差分析表表示计算结果,其形式为: 方差来源 平方和 自由度 均方 F值 临界值 因素A K-1 F 误差 N-K

文档评论(0)

qwd513620855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档