统计学第5 方差分析.pptVIP

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学第5 方差分析

第5章 方差分析 Analysis of Variance (ANOVA) 5.1 方差分析简介 5.2 单因素方差分析 5.3 双因素方差分析 学习目标 掌握方差分析中的基本概念; 掌握方差分析的基本思想和原理; 掌握单因素方差分析的方法及应用; 初步了解多重比较方法的应用; 了解双因素方差分析的方法及应用。 5.1 方差分析中的基本概念和假设 为什么要进行方差分析? 要研究的问题 各个总体的均值相等吗? 研究方法:两样本的t检验? 用t检验比较两个均值: 每次只能比较两个均值,要解决上述问题需要进行6次t检验…… 在整体检验中犯第一类错误的概率显著增加: 如果在每次t检验中犯第一类错误的概率等于5%,则在整体检验中等于1-(1-0.05)6=0.2649 方差分析可以用来比较多个均值 方差分析(Analysis of variance,ANOVA)的主要目的是通过对方差的比较来检验多个均值之间差异的显著性。 可以看作t检验的扩展,只比较两个均值时与t检验等价。 20世纪20年代由英国统计学家费希尔(R. A. Fisher)最早提出的,开始应用于生物和农业田间试验,以后在许多学科中得到了广泛应用。 5.1.1 方差分析中的几个基本概念 因变量:我们实际测量的、作为结果的变量,例如失业持续时间。 自变量:作为原因的、把观测结果分成几个组以进行比较的变量例如奖金水平。 在方差分析中,自变量也被称为因素(factor)。 因素的不同表现,即每个自变量的不同取值称为因素的水平。 5.1.1 基本概念 方差分析主要用来研究一个定量因变量与一个或多个定性自变量的关系 只有一个自变量的方差分析称为单因素方差分析。 研究多个因素对因变量的影响的方差分析称为多因素方差分析,其中最简单的情况是双因素方差分析。 5.1.1 :固定效应与随机效应模型 固定效应模型:因素的所有水平都是由实验者审慎安排而不是随机选择的。 随机效应模型:因素的水平是从多个可能的水平中随机选择的。 固定效应和随机效应模型在假设的设置和参数估计上有所差异,本章研究的都是固定效应模型。 5.1.2:方差分析中的基本假设 (1)在各个总体中因变量都服从正态分布; (2)在各个总体中因变量的方差都相等; (3)各个观测值之间是相互独立的。 (1)正态性的检验 各组数据的直方图 峰度系数、偏度系数 Q-Q图, K-S检验* (2)等方差性的检验 经验方法:计算各组数据的标准差,如果最大值与最小值的比例小于2:1,则可认为是同方差的。 最大值和最小值的比例等于1.832 Levene检验 * (3) 其它说明 方差分析对前两个假设条件是稳健的, 允许一定程度的偏离。 独立性的假设条件一般可以通过对数据搜集过程的控制来保证。 如果确实严重偏离了前两个假设条件,则需要先对数据进行数学变换,也可以使用非参数的方法来比较各组的均值。 5.2. 单因素方差分析 5.2.1 单因素方差分析模型 5.2.2方差分析的基本原理 5.2.3 单因素方差分析的步骤 5.2.4 方差分析中的多重比较 5.2.1 单因素方差分析模型 单因素方差分析: 模型中有一个自变量 (因素)和一个因变量。 在失业保险实验中假设张三在高奖金组,则 张三的失业时间 =高奖金组的平均失业时间 +随机因素带来的影响 =总平均失业时间 +高奖金组平均值与总平均值之差 + 随机因素带来的影响 5.2.2 :总变差(离差平方和)的分解 5.2.2 :组间方差和组内方差 各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方。 计算方法是用离差平方和除以相应的自由度 三个平方和的自由度分别是 SST 的自由度为n-1,n为全部观察值的个数 SSA的自由度为r-1,其中r为因素水平的个数 SSE 的自由度为n-r 5.2.2 :组间方差和组内方差 5.2.2 :方差分析的基本思想 如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近1 如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。 5.2.3 :方差分析的步骤 1.检验数据是否符合方差分析的假设条件。 2.提出零假设和备择假设: 零假设:各总体的均值之间没有显著差异,即 备择假设:至少有两个均值不相等,即 5.2.3 :方差分析的步骤 3.根据样本计算F统计量的值。 5.2.3 :方差分析的步骤 4.确定决策规则并根据实际值与临界值的 比较,或者p-值与α的比较得出检

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档