- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章方差分析(精品课程)
第三章方差分析(初稿)
3.1 单因素方差分析的数学模型
首先让我们看两个例子:
例3.1 设甲、乙、丙三块麦田的基本苗数(按面积大小抽取样本点数)得表3.1,问三块地的基本苗数是否有显著差别?
表3.1三块麦田的基本苗数
甲 乙 丙 21 20 24 29 25 22 24 25 28 22 23 25 25 29 21 30 31 26 27 24 . 26 26 . . 20 . . 21 .
例3.2为了研究淬火温度和等温温度对铣刀硬度的影响三
种不同淬火温度和三种等温温度淬火,测得铣刀平均硬度如表3.2,检验淬火温度及等温温度是否对硬度y有显著影响。
表3.2 淬火温度与等温温度对硬度的影响
淬火温度
等温温度 B1 B2 B3 A1 64 66 68 A2 66 68 67 A3 65 67 68
这两个例子和以前回归分析的问题不同.首先,它们都只考察某种因素(地块、淬火温度、等温温度)在一系列试验中对产品某个指标(寿命、得率)的影响是否显著,而不要求建立回归方程;其次,这些因素可以不是定量的(如地块),即或这些因素是定量(如淬火温度与等温温度)但其数值也不作为回归中变量的观察值,而只是代表一种处理(试验方案);最后,当因素确定后,可以作反复的试验。这两个例子和以前均值假设检验也不同,均值假设检验不考虑因素问题,而方差分析要考虑。
在许多科学研究中都遇到和这两个例子类似的问题。尤其是科学研究中常涉及许多因素,例如研究作物栽培时,要考虑播种期、品种、土质、施肥方式、灌溉方式对产量的影响;在化学反应中要观察原料成分、剂量、催化剂、温度、压力,搅拌速度等对得率的影响。这些因素中要选出影响大的,以进一步安排更细致的试验,而判断一个因素的影响“是否大”的主要方法就是方差分析。
我们所考察的。影响产品指标的因素(如产地,温度等)也称为因子,用大写字母A,B,C表示,例1有一个因子(地块),例2有2个因子(如淬火温度与等温温度)。因素所能处的状况,如甲、乙、丙;60,65,70,75,……,称为因子的水平,简称为水平。例1的因子有三个水平(甲、乙、丙),例2每个因子恰也有3个水平,水平常以表示。
因子也可以看成是一种变量,其取值不是数,而是水平。例如“产地”是一个变量,它取的值是“北京”、“上海”、“南京”等。这种变量称为属性变量,定性变量或分类变量.本节只讨论一个因子,即一个分类变量的方差分析——单因子方差分析。
方差分析的目的在于找出自变量与因变量之间的线性关系,或自变量对因变量的实验效果。这种实验效果可分为:主效果、交互效果、镶嵌效果。
Qualitative Variable(自变量,又称独立变量、定性变量),Classification Variable(分类变量,其数值多半是不连续的。Response Variable(因变量,又称反应变量,其数值则是连续的)
一般地,假设因素A有k个水平:。第j个水平做实验次,得指标y,的个数据。例3.1中。通常作如下假设:
同一个水平下得到的观测值,是由于实验过程中各种偶然因素的干扰及测量误差所致,每次实验中这些偶然因素的总和称为实验误差,它们是方差相同的零均值正态随机变量;
所有误差相互独立;
由于水平的不同,可能会给一个定量的确定性的影响,其大小是未知的。
于是我们建立单因子方差分析数学模型
(3.1)
其中相互独立,。(4.1)式称为单因素方差分析的数学模型。
判断这个因素的影响是否显著就是要检验假设:
,不全相等
令 ,,
容易证明是的最小二乘估计
作方差分解
并令
,
即: -----总的误差平方和
组内差,反映试验误差影响的大小。
------组间差,反映因素A的各个水平不同引起的误差,若A的水平引起的误差显著时, 就比较大,反之就比较小。
则有:
分别称为组内差和组间差。组内差又称为误差,用以估计实验误差影响的大小;组间差反映因素A的水平不同引起的系统差异。若A的水平不同引起的系统差异(即组间的差距)显著时,SSA就比较大;反之,当A引起的系统差异不显著时,SSA就比较小.而SSE主要是由试验误差引起的。SSA由k个平方之和形成,但有一个恒等式约束,只有k-1个自由度;同理SSE有n-k个自由度。下列定理给出SSA/SSE的分布
定理: 对于所给的模型,若成立时,
则
如果F的值超过临界值(通常取为),就否定;当F超过时,就称为高度显著。当成立时,F的值不应太大,若F的值大于临界值时,就应否定,即认为间存在显著差异。
一般总用方差分析表表示计算结果,其形式为:
方差来源 平方和 自由度 均方 F值 临界值 因素A K-1 F 误差 N-K
文档评论(0)