- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
方差分析汇
方差分析 方差分析 第一节: 方差分析的基本问题 第二节: 单因素方差分析 第三节: 双因素方差分析 第四节: 方差分析与实验设计 什么是方差分析(ANOVA)?(analysis of variance) 检验多个总体均值是否相等 通过分析察数据的误差判断各总体均值是否相等 研究分类型自变量对数值型因变量的影响 一个或多个分类尺度的自变量 2个或多个 (k 个) 处理水平或分类 一个间隔或比率尺度的因变量 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量 什么是方差分析? (一个例子) 什么是方差分析? (例子的进一步分析) 检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同 设?1为无色饮料的平均销售量,?2粉色饮料的平均销售量,?3为橘黄色饮料的平均销售量,?4为绿色饮料的平均销售量,也就是检验下面的假设 H0: ?1 ? ?2 ? ?3 ? ?4 H1: ?1 , ?2 , ?3 , ?4 不全相等 检验上述假设所采用的方法就是方差分析 所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差 这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源。 方差分析的基本思想和原理(几个基本概念) 因素或因子 所要检验的对象称为因子 要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子 水平 因素的具体表现称为水平 A1、A2、A3、 A4四种颜色就是因素的水平 观察值 在每个因素水平下得到的样本值 每种颜色饮料的销售量就是观察值 方差分析的基本思想和原理(几个基本概念) 试验 这里只涉及一个因素,因此称为单因素四水平的试验 总体 因素的每一个水平可以看作是一个总体 比如A1、A2、A3、 A4四种颜色可以看作是四个总体 样本数据 上面的数据可以看作是从这四个总体中抽取的样本数据 方差分析的基本思想和原理(两类误差) 随机误差 在因素的同一水平(同一个总体)下,样本的各观察值之间的差异 比如,同一种颜色的饮料在不同超市上的销售量是不同的 不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称为随机误差 系统误差 在因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同颜色饮料的销售量也是不同的 这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差 方差分析的基本思想和原理(两类方差) 数据的误差用平方和(sum of squares)表示,称为方差 组内方差(within groups) 因素的同一水平(同一个总体)下样本数据的方差 比如,无色饮料A1在5家超市销售数量的方差 组内方差只包含随机误差 组间方差(between groups) 因素的不同水平(不同总体)下各样本之间的方差 比如,A1、A2、A3、A4四种颜色饮料销售量之间的方差 组间方差既包括随机误差,也包括系统误差 方差分析的基本思想和原理(方差的比较) 如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1 如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异 方差分析的基本假定 方差分析中的基本假定 每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本 比如,每种颜色饮料的销售量必需服从正态分布 各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的 比如,四种颜色饮料的销售量的方差都相同 观察值是独立的 比如,每个超市的销售量都与其他超市的销售量独立 方差分析中的基本假定 在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题 如果四个总体的均值相等,可以期望四个样本的均值也会很接近 四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分 样本均值越不同,我们推断总体均值不同的证据就越充分 方差分析中基本假定 ? 如果原假设成立,即H0: m1 = m2 = m3 = m4 四种颜色饮料销售的均值都相等 没有系统误差 这意味着每个样本都来自均值为??、方差为?2的同一正态总体 方差分析中基本假定 ?如果备择假设成立,即H1: mi
文档评论(0)