统计学:5方差分析.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 5 章 方差分析 5.1 方差分析的基本原理 5.2 单因素方差分析 5.3 双因素方差分析 学习目标 方差分析的基本思想和原理 单因素方差分析 多重比较 双因素方差分析的方法 管理者层次水平的不同是否会导致评分的显著差异? 一家管理咨询公司为高、中、初级管理者提供人力资源讲座。听完讲座后随机抽取不同层次管理者大满意度评分,取0.05的显著性水平,检验管理者层次水平的不同是否会导致评分的显著差异? 什么是方差分析(ANOVA)?(analysis of variance) 方差分析的基本原理是在20世纪20年代由英国统计学家Ronald A.Fisher在进行实验设计时为解释实验数据而首先引入的 (形式上)检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等 (本质上)研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量 一个数值型因变量 有单因素方差分析和双因素方差分析 方差分析的基本假定 正态性(normality)。每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本 方差齐性(homogeneity variance)。各个总体的方差必须相同,对于分类变量的k个水平,有?12=?22=…=?k2 独立性(independence)。每个样本数据是来自因子各水平的独立样本(该假定不满足对结果影响较大) 如果原假设成立,即H0 :m1=m2=……=mk 自变量对因变量没有显著影响 每个样本都来自均值为??、方差为? 2的同一正态总体 ?若备择假设成立,即H1 :mi (i=1,2,k)不全相等 自变量对因变量有显著影响 至少有一个总体的均值是不同的 3个样本分别来自均值不同的3个正态总体 方差分析的基本原理(误差分解) 总误差——总平方和(SST) 反映全部观测数据的误差大小的平方和, 反映全部观测值的离散程度 组内误差——组内平方和(SSE) 由于抽样的随机性造成的误差 反映每个样本内数据之间的离散程度 组间误差——组间平方和(SSA) 不同的水平(处理)影响所造成的误差 反映不同水平样本之间数据的差异 误差平方和的分解及其关系 误差的大小用均方(mean square)来表示,也称为方差(variance) 平方和除以相应的自由度 总平方和(SST)的自由度为n-1; 组内平方和(SSE)的自由度为n-k ; 组间平方和(SSA)的自由度为k-1 组内方差 3. 组间方差 判断原假设是否成立,就是判断组间方差与组内方差是否有显著差异 若原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近1 若原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,即自变量对因变量有影响 (one-way analysis of variance) 只考虑一个分类型自变量对数值型因变量的影响 分析步骤 提出假设 构造检验统计量 做出决策 提出假设 一般提法 H0 :m1 = m2 =…= mk 自变量对因变量没有显著影响 H1 :m1 ,m2 ,… ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 构造检验的统计量F 计算各样本均值 计算全部观测值的均值 3. 计算各误差平方和 构造检验的统计量F 做出决策 ? 将统计量的值F与给定的显著性水平?的临界值F?进行比较(或计算出统计量的P值),做出决策 若P<? (F>F? ),拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的分类变量的不同水平对观察值有显著影响 若P>? (F<F? ) ,不拒绝原假设H0 ,无证据表明所检验的分类变量的不同水平对观察值有显著影响 作出决策(F分布与拒绝域) 【例】检验行业(分类变量)对投诉次数(数值变量)是否有显著影响(?=0.05) (例题分析) 提出假设。设不同行业投诉次数均值分别为?1(零售业)、 ?2(旅游业)、?3 (航空公司) 和?4 (家电制造业) ,提出的假设为 H0 :?1 ? ?2 ? ?3 ? ?4 H1 :?1 , ?2 , ?3 , ?4不全相等 检验方差分析的前提 进行分析并做出决策 计算各误差平方和 计算统计量F 统计决策 拒绝原假设,即行业对投诉次数有显著影响 用spss进行方差分析 关系强度的测量 拒绝原假设表明因素(因子、分类变量)与观测值之间有显著关系 组间平方和(SSA)度量了自变量(分类变量,行业)对因变量(数值变量,投诉次数)的影响效应 当组间平方和

文档评论(0)

学习让人进步 + 关注
实名认证
内容提供者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档