统计学第七篇 方差分析.ppt

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 方差分析 一、 方差分析的基本问题 二、 单因素方差分析 三、 双因素方差分析 方差分析(Analysis of Variance, ANOVA)是假设检验的一种延续与扩展,它可以解决诸如多个均值是否相等等方面的检验问题,在因素分析中具有一定的优势。 例4:一个儿童食品制造商生产儿童麦片,该制造商认为以下三种因素影响麦片味道: (1)麦片中小麦与玉米的比例; (2)甜味剂类型的选择:糖、蜂蜜等; (3)制作时间的长短。 该例中,食品制造商通过生产出不同类型的麦片并邀请儿童进行品尝试验,最后发现: (1)麦片成份及甜味剂类型对麦片食味有很大影响; (2)制作时间对麦片食味没有影响。 方差分析主要用来对多个总体均值是否相等作出假设检验。 例:某饮料制造商生产一种新型饮料,共有四种颜色: (1)橘黄、(2)粉红、(3)绿色、(4)无色。 该制造商想知道颜色是否对销售量有显著影响,随机抽取了5家超市前一期的销售量(下表)进行分析。 其中, ?i(I=1,2,3,4) 表示所有饮料(无色、粉红、橘黄、绿色)销售量之均值。 1、相关术语 因素:是一个独立的变量,是方差分析的研究对象 (上例中的饮料颜色); 在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题 如果四个总体的均值相等,可以期望四个样本的均值也会很接近 四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分 样本均值越不同,我们推断总体均值不同的证据就越充分 ? 如果原假设成立,即H0: m1 = m2 = m3 = m4 四种颜色饮料销售的均值都相等 没有系统误差 这意味着每个样本都来自均值为??、差为?2的同一正态总体 ?如果备择假设成立,即H1: mi (i=1,2,3,4)不全相等 至少有一个总体的均值是不同的 有系统误差 这意味着四个样本分别来自均值不同的四个正态总体 观察值之间的差异来自两个方面: 提出假设 一般提法 H0: m1 = m2 =…= mk (因素有k个水平) H1: m1 ,m2 ,… ,mk不全相等 对前面的例子 H0: m1 = m2 = m3 = m4 颜色对销售量没有影响 H0: m1 ,m2 ,m3, m4不全相等 颜色对销售量有影响 构造检验的统计量 为检验H0是否成立,需确定检验的统计量 构造统计量需要计算 水平的均值 全部观察值的总均值 离差平方和 均方(MS) 构造检验的统计量 (计算水平的均值 ) 假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数 计算公式为 构造检验的统计量 (计算全部观察值的总均值 ) 全部观察值的总和除以观察值的总个数 计算公式为 构造检验的统计量 (前例计算结果 ) 构造检验的统计量 (计算总离差平方和 SST) 全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况 其计算公式为 构造检验的统计量 (计算误差项平方和 SSE) 每个水平或组的各样本数据与其组平均值的离差平方和 反映每个样本各观察值的离散状况,又称组内离差平方和 该平方和反映的是随机误差的大小 计算公式为 构造检验的统计量 (计算水平项平方和 SSA) 各组平均值 与总平均值 的离差平方和 反映各总体的样本均值之间的差异程度,又称组间平方和 该平方和既包括随机误差,也包括系统误差 计算公式为 构造检验的统计量 (三个平方和的关系) ?总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系 构造检验的统计量 (三个平方和的作用) SST反映了全部数据总的误差程度;SSE反映了随机误差的大小;SSA反映了随机误差和系统误差的大小 如果原假设成立,即H1= H2 =…= Hk为真,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差 判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小 为检验这种差异,需要构造一个用于检验的统计量 构造检验的统计量 (计算均方 MS) 各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档