- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一讲 方差分析 1.1 方差分析的概念 1.2 单因素方差分析 1.3 有交互作用的双因素方差分析 1.4 无交互作用的双因素方差分析 例1:某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表,试分析饮料的颜色是否对销售量产生影响。 方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存在差异以及分析差异原因的方法和技术。 方差分析由英国统计学家R.A.Fisher首创,为纪念Fisher,方差分析又称 F 检验 (F test)。用于推断多个总体均值有无差异 三、方差分析的基本思想 比较两类误差 以检验均值是否相等 随机误差和系统误差 组间方差:因素的不同水平 不同总体 下各样本之间的方差 比如,例1中橘黄色、粉色、绿色和无色透明四种颜色饮料销售量之间的方差。组间方差既包括随机误差,也包括系统误差。 方差的比较 如果不同颜色 水平 对销售量 结果 没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1。 如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1。 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。 四、基本假定 1.每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本 比如,每种颜色饮料的销售量必须服从正态分布 2.各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的。 比如,四种颜色饮料的销售量的方差都相同。 3.不同水平下的样本相互独立 二、平方和的分解 ST是全部观察值与总平均值的离差平方和,反映全部观察值的离散状况,从而反映了全部数据总的误差程度。 SA既包括随机误差,也包括系统误差,反映的是随机误差和系统误差的大小。 总误差平方和 组间误差平方和+组内误差平方和 如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响; 反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或抽样的结果有显著作用。 判断因子的不同水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。 检验这种差异,需要构造一个用于检验的统计量。 1.3 有交互作用的双因素方差分析 一、问题的引出 在实际问题的分析中,常常需要考虑多个因素的影响。如在对某商品销售量影响因素的分析中,除了考虑广告内容的影响,还要考虑销售价格、包装等因素的影响。——多因素的方差分析 若只考虑两个因素的影响——双因素的方差分析 有交互作用的双因素方差分析 无交互作用的双因素方差分析 二、数学模型 1.4 无交互作用的双因素方差分析 p anova1 B :,2:4 例2 为比较同一类型的三种不同食谱的营养效果,将19支幼鼠随机分为三组,各采用三种食谱喂养. 12周后测得体重,三种食谱营养效果是否有显著差异? 187 212 215 220 248 265 281 丙 185 197 201 231 乙 164 190 203 205 206 214 228 257 甲 体重增加量 食谱 解:这是单因素非均衡数据的方差分析 A [164 190 203 205 206 214 228 257 185 197 201 231 187 212 215 220 248 265 281]; group [ones 1,8 ,2*ones 1,4 ,3*ones 1,7 ]; p anova1 A, group 方差分析表 均值盒子图 由于概率p 0.1863比较大,故认为三种食料没有显著差异. 五、因素各水平均值的估计与比较 从例1的结果可以知道四种饲料对鱼类体重增长效果有显著差异,如何进一步比较选择最优的因素水平? 1.各水平均值的估计及其置信区间 根据方差分析的要求每个因素水平Ai的数据来自正态分布N ?i,?2 ,因此样本均值 标准化得到 又因为 ,所以 进而根据 定理:设X~N 0,1 , 则 因为 代入定理立得 对给定的置信水平?,可得 ?i置信度为1- ?的置信区间为: 2. 各对均值差的置信区间 根据两样本均值差构造标准正态分布,进而得到两样本的T统计量,于是?i- ?j置信度1-?的置信区间 3. 多重
文档评论(0)