协方差分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我们先来看一个问题: 芬兰由几十个小的自治区组成。在芬兰,白酒的批发和零售是国家垄断的。几个世纪以来,法律规定白酒只能在城市自治区中销售。 但是去年这条法律要做修改了,该国的相关部门尝试性地在农村自治区销售白酒,进而研究白酒的销售方式是否会影响当地的交通事故量 在去年夏天,他们任选12个农业自治区,在其中4个开设了白酒专卖店;另外4个授权饭店销售白酒;余下的4个保持原来的状态,即禁止销售白酒。 为比较销售白酒对交通事故是否有影响,我们搜集到三组实验区域一年后的交通事故发生数: 销售白酒对当地的交通事故有影响吗? 认为白酒的销售没有影响交通事故率。真的是这样吗? 稍加分析我们就会发现,我们的分析有问题  直接收集统计资料的有两种方式:实验式和非实验式。 如果条件可以完全控制的话(只一个因素变化,其他因素统一)实验式收集数据进行方差分析理论上是可以保证精度的。 但是实验条件不能完全控制的时候就要采取统计控制,即用统计的方法排除数据中的干扰因素从而提高精度。——我们知道,就算12个地区白酒的销售方式是随机指定的,由于每组仅仅有四个地区,很难保证三组地区的交通事故只与白酒的销售有关而其他因素统一水平。 协方差分析可以解决这类问题。 协方差分析是如何解决这个问题的呢? 观测值=一般均值+水平影响+协变量影响+随机误差 从离差分解的角度我们来解释协方差分析 于是,我们用协变量对观测值进行修正,去掉“遗传”因素 下面的问题是,如何计算回归系数 我们把回归系数的计算分为两种情况 计算总离差平方和时: 我们最终要检验的是分组自变量对因变量有无显著作用.原假设是无显著作用.假设检验以原命题为真为基础进行的.因此,这里我们认为ti=0,即,用回归模型计算回归系数.其最小二乘无偏估计值为 为了简化表示,我们定义 当计算组内离差平方和时,我们使用组内回归系数  它的计算如下: 同样为了简化表示,我们定义 接着就要计算组间平方和了。它反映的是各个水平之间的差异 回头从离差分解的角度我们来解释协方差分析 总离差=分组变量离差+协变量离差+随机误差 我们回头看协方差分析的模型 使用该方法进行分析的前提是每组的回归系数相等,且不为零。回归系数反映的是协变量对观测值的影响。只有这种影响的作用形式相同,才能用该模型。 当然,如果回归系数为零的话,用协方差分析也没有意义了。因此我们在做协方差分析前要做两个假设检验. 1.协变量对因变量的影响对与个组来说都是相同的,即各组回归系数相等: 2.这些相等的回归系数不为零: 检验各组的回归系数相等时要先按回归系数不相等表示模型: 然后我们比较按照回归系数相等和回归系数不等计算出的误差平方和是否有显著差异 构造回归系数非零的假设检验时我们回顾一下一元线性回归显著性检验: 到这里我们把单因素的协方差分析的方法模型介绍完了。 回头看芬兰白酒专卖的例子。 为了更具体地进行协方差分析,我们回过头来看芬兰白酒专卖的例子: 我们当时的观测数据来自12个不同的自治区,同一个自治区应该有其一定的特殊性,这样就使得个地区观测值的可比性降低了。那么,怎么样去除这种特殊性呢?这种地区的特殊性在统计上表现为观测前一年的数据(X)和观测年的数据具有回归关系。这里面X就是协变量,在协方差分析中可以分离出协变量效应,从而提高分析结果的精度.为此我们收集到前一年,也就是各个自治区都没有销售白酒的那一年交通事故的数据,并把他们整理在下表中: 要进行协方差分析,我们要先进行两个前提假设: 再计算各组内X作用的平方和 最后计算总的组内离差平方和 最后计算F值: 为此我们计算以下项目: 我们继续分析白酒的销售对交通事故是否有影响. 为了得到F统计量,我们要求出组间离差平方和的修正值和组内离差平方和的修正值。为此我们要求出 N项,有两个约束条件,DF=N-2 N项,K+1个约束df-=N-k-1 总离差平方和 它表示没有X的影响,单纯考察数据中Y的变动情况。 表示各 的变动程度,该变动是由于回归直线中 各Xi 的变动所引起的,并且通过X对Y的线性影响表现出来。 图9-5 总平方和分解图 表示各Yi围绕所拟合的回归直线的变动程度, 回归平方和 误差平方和 SSTO=SSR+SSE 协方差分析 开设白酒专卖店 授权饭店销售 保持禁销白酒 12个实验自治区 12地区总平均事故数 188 206 176 229 196 225 214.50 206.50 186.25 每组平均事故数 215 198 167 226 226 177 交通事故报告数 授权 饭店代销 开设 白酒专卖店 无授权 授权销售白酒类型(要素水平) 407.8611 9 3670.75 组内 4.256495 0.180982 2.079343 848.0833 2 1696

文档评论(0)

传世 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档