2016数据分析方法07-方差分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2016数据分析方法07-方差分析

第六章 SPSS的方差分析授课教师:杨小宝北京交通大学 交通运输学院2016.09品质变量X数值型变量X品质变量Y交叉列联表、对应分析、对数线性模型Logistic回归数值型变量Y方差分析相关与回归分析SPSS的方差分析6.1 方差分析概述6.2 单因素方差分析6.3 多因素方差分析6.4 方差分析中的其它问题 6.1 方差分析概述当两个总体方差相等时,可用 t 检验来检验两个总体均值间的差异性;当总体是三个或三个以上时如何检验呢?就要用本章的方差分析。它是在二十世纪20年代由英国著名统计学家R.A.Fisher首先应用到农业试验中的。 方差分析的一个例子【例】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见表5-1。试分析饮料的颜色是否对销售量产生影响。表8-1该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8例子的进一步分析检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同设?1为无色饮料的平均销售量,?2粉色饮料的平均销售量,?3为橘黄色饮料的平均销售量,?4为绿色饮料的平均销售量,也就是检验下面的假设H0: ?1 ? ?2 ? ?3 ? ?4 H1: ?1 , ?2 , ?3 , ?4 不全相等检验上述假设所采用的方法就是方差分析6.1.2 相关概念1、控制因素和随机因素 在所有的影响因素中可以分为两类:一类是人为可以控制的因素,称为控制因素或控制变量,如种子品种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机因素或随机变量,如气候和地域等影响因素。在多数情况下随机因素指的是实验过程中的抽样误差。方差分析的几个基本概念2、因子--控制因素/变量所要检验的对象称为控制因素/变量或因子要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子3、水平控制变量的不同取值称为水平A1、A2、A3、 A4四种颜色就是因素的水平4、观察值在每个因素水平下得到的样本值每种颜色饮料的销售量就是观察值方差分析中的基本假定每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每种颜色饮料的销售量必需服从正态分布各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的比如,四种颜色饮料的销售量的方差都相同观察值是独立的比如,每个超市的销售量都与其他超市的销售量独立6.1.3 方差分析的原理 方差分析认为,如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。 根据控制变量的个数可将方差分析分为单因素方差分析、多因素方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因变量方差分析)和多元方差分析(多因变量方差分析)。6.2 单因素方差分析6.2.1 基本思想6.2.2 基本步骤6.2.3 基本操作6.2.4 应用举例6.2.1 基本思想数学模型1、定义: 单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生显著影响;研究不同学历是否对工资收入产生显著影响等。2、观测变量方差的分解将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别表示为: 其中,SST为观测变量的总离差平方和;SSA为组间离差平方和,是由控制变量不同水平造成的观测变量的变差;SSE为组内平方和,是由抽样误差引起的观测变量的变差。其中:它反映了观测数据总的变异程度反映因子A的不同水平效应间的差异反映了随机误差?ij 对响应值影响的总和各离差平方和的计算-例题职本工资101410441014984859989889866职本工资8488279388878878248248243、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响。 这里我们用F统计量来表示这种比例关系,如果控制变量的不同水平对观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较大,则F值就比较大

文档评论(0)

整理王 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档