第6章方差分析.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 6章 方差分析 学习目标 6.1 方差分析的基本问题 6.2 单因素方差分析 6.3 双因素方差分析 学习重点 解释方差分析的概念 解释方差分析的基本思想和原理 掌握单因素方差分析的方法及应用 4. 掌握双因素方差分析的方法及应用 6.1 方差分析的基本问题 什么是方差分析(ANOVA)? 什么是方差分析? (例题分析) 【 例 】某饮料企业研制出的一种新型饮料。饮料有四种颜色,分别为桔黄色、粉色、绿色和无色透明。随机从五家超市上收集前一期该饮料的销售量,如下表所示: 什么是方差分析? (例题分析) 分析饮料颜色对其销售量是否有显著差异。 即检验这四种颜色饮料的销量的均值是否相等 若它们的均值相等,则意味着饮料颜色对其销售量是没有影响的,即它们之间的销量没有显著差异;若均值不全相等,则意味着饮料颜色对其销售量是有影响的,它们之间的销售量有显著差异 方差分析中的有关术语 因素或因子(factor) 所要检验的对象 要分析颜色对饮料的销量是否有影响,颜色是要检验的因素或因子 水平或处理(treatment) 因子的不同表现 无色、粉色、桔黄色、绿色就是因子的水平 观察值 在每个因素水平下得到的样本数据 每种颜色饮料的销量就是观察值 方差分析的基本思想和原理 (两类误差) 随机误差 因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一颜色下不同销售地点的销量是不同的 这种差异可以看成是随机因素的影响,称为随机误差 系统误差 因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同颜色饮料销量之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差 方差分析的基本思想和原理 1. 比较两类误差,以检验均值是否相等 2. 比较的基础是方差比 3. 如果系统(处理)误差明显地不同于随机误差,则均值就是不相等的;反之,均值就是相等的 4. 误差是由各部分的误差占总误差的比例来测度的 方差分析的基本思想和原理 (误差平方和) 数据的误差用平方和(sum of squares)表示 组内平方和(within groups) 因素的同一水平(同一个总体)下样本数据的平方和 组内平方和只包含随机误差 组间平方和(between groups) 因素的不同水平(不同总体)下各样本之间的平方和 组间平方和既包括随机误差,也包括系统误差 方差分析的基本思想和原理 (误差的比较) 若原假设成立,组间平方和与组内平方和经过平均后的数值就应该很接近,它们的比值就会接近1 若原假设不成立,组间平方和平均后的数值就会大于组内平方和平均后的数值,它们之间的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响 判断颜色对饮料销量是否有显著影响,也就是检验销量的差异主要是由于什么原因所引起的。如果这种差异主要是系统误差,说明不同颜色对饮料销量有显著影响 6.2 单因素方差分析 设因素有k个水平,每个水平的均值分别用?1 , ?2, ?, ?k 表示 要检验k个水平(总体)的均值是否相等,需要提出如下假设: H0 : ?1 ? ?2 ? …? ?k H1 : ?1 , ?2 , ?,?k 不全相等 设?1为无色饮料销量的均值,?2为粉色饮料销量的均值,?3为桔黄色饮料销量的均值,?4为绿色饮料销量的均值,提出的假设为 H0 : ?1 ? ?2 ? ?3 ? ?4 H1 : ?1 , ?2 , ?3 , ?4 不全相等 单因素方差分析的数据结构 (one-way analysis of variance) 分析步骤 提出假设 构造检验统计量 统计决策 提出假设 一般提法 H0 : m1 = m2 =…= mk 自变量对因变量没有显著影响 H1 : m1 ,m2 ,… ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 构造检验的统计量 构造统计量需要计算 水平的均值 全部观察值的总均值 误差平方和 均方(MS) 构造检验的统计量 (计算水平的均值) 假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数 计算公式为 构造检验的统计量 (计算全部观察值的总均值) 全部观察值的总和除以观察值的总个数 计算公式为 构造检验的统计量 (计算总离差平方和 SST) 全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况 其计算公式为 构造检验的统计量 (计算水平项平方和 SSA) 各组平均值

您可能关注的文档

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档