- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7.方差分析和一般线性模型
试验设计数据的方差分析 和一般线性模型 吴喜之 试验设计 在几乎所有领域都有各种试验。比如 如何对不同的土壤、气候等各种条件找出最合适的作物,使得收益最大 如何使得工业产品优质、价廉 什么环境下,儿童才能在心理上健康成长 企业采取的什么主动措施能够增加收益 试验设计模型就是回归模型 在水产养殖业中,比如养蟹,因变量是产量,自变量是水温,饲料,疾病等。 描述试验设计的模型就是回归模型的一种 但试验设计问题本身有很大一部分是如何设计试验,使得人们有可能用最少的资源得到最好的结果。 当然,我们不打算详细讨论如何设计试验,而把主要精力放在试验设计数据的方差分析上。 方差分析 方差分析(analysis of variance,ANOVA)是分析各个自变量对因变量影响的一种方法。 这里的自变量就是定性变量的因子及可能出现的称为协变量(covariate)的定量变量。 分析结果是由一个方差分析表给出的。 方差分析分解因素贡献的机理 原理为:因变量的值随着自变量的不同取值而变化。我们把总变化(差的平方和)按照自变量(因素)进行分解,显示每一个自变量的贡献;最后剩下无法用已知的因素解释的则看成随机误差的贡献。 然后用各自变量的贡献和随机误差的贡献进行比较(F检验),以判断该自变量的不同水平是否对因变量的变化有显著贡献。输出就是F-值和检验的一些p-值。 下面看一个例子。 单因素方差分析回顾(data12.01) 饲料比较数据, n=19头猪, 用p=4种饲料喂养一段时间后的重量增加问题: 四种饲料是否不同? 饲料例子(继续):饲料(fodder)为自变量(单因子),重量增加(weight) 为因变量(一个数量变量) (SPSS计算机数据形式有所不同) 销售数据(sales.sav) 研究这个数目的主要目的是看销售额(因变量)是否受到促销方式、售后服务和奖金这三个自变量的影响(头两个是定性变量,亦称为因子,分别有3个和2个水平;而定量变量奖金是协变量)以及怎样的影响。 多因素方差分析(只考虑主效应,不考虑交互效应及协变量) 首先假定自变量受到的仅仅有不同因素的主效应(main effect)而没有交互效应(interaction)和协变量(covariate)的影响。 主效应就是每个自变量对因变量的单独影响,而交互效应是当两个或更多的自变量的某些水平同时出现时除了主效应之外的附加影响(“正面”或者“负面”的影响)。 多因素方差分析(只考虑主效应,不考虑交互效应及协变量) 拿我们例子来说,当单独考虑时,假定主动促销比被动促销可以多产生8万元效益,而有售后服务比没有售后服务多产生9万元效益。那么在没有交互作用时,同时采取主动促销和售后服务会产生8+9=17万元的效益(称为可加的)。 如存在交互效应,那么同时采取主动促销和售后服务会产生一个附加的效应即交互效应(可正可负),这时的总效应就不是17万元了。 方差分析(只考虑主效应,不考虑交互效应及协变量) 如要分析的只是因变量销售额和自变量促销和售后服务的主效应。用y表示销售额,ai表示促销(下标表示不同水平),bj表示售后服务;则相应的只有主效应的线性模型为: SPSS实现(只有因子主效应的方差分析) 拿sales.sav为例,在SPSS中选Analyze-General Linear Model-Univariate进入主对话框; 然后把sales选入Dependent Variable,把promot和service选入Fixed Factors; 然后点击Model,选择Custom,在Build Terms中选择Main effects,再把promot(F)和service(F)选入Model; 选择或不选择Include intercept in model则确定是否在模型中包含常数项;回到主对话框(Continue),这时点OK即可; 如果要输出参数估计可以在Options选诸如Parameter Estimates等。 方差分析 如再加上作为协变量的定量变量奖金,看它对销售有没有影响;模型就又多了一个代表自变量奖金x的一项(加上系数g)g x: 还要说明的是,如果每一种因子水平的组合只有一个观测值(这里例中每个组合有四个观测值),那么,无法对是否有交互作用进行判断;这是由于数据量不够,交互作用即使有也混在误差项中,无法剥离出来进行分析。 方差分析表的意义 方差分析表的意义 * 饲料 A B C D 133.8 151.2 193.4 225.8 125.3 149.0 185.3 224.6 143.1 162.7 182.8 220.4 128.9 143.8 188.5 212.3 135.7 153.5
文档评论(0)