简介anova变异数分析在统计中是常见的分析方式应用在.docVIP

简介anova变异数分析在统计中是常见的分析方式应用在.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简介anova变异数分析在统计中是常见的分析方式应用在

一、简介: ANOVA(变异数分析)在统计中是常见的分析方式,应用在分析一个(One-Way)或多个qualitative 自变量 对 (连续的) quantitative? 应变量的分布的期望值的影响。例如我们想探讨某种饮料--例如咖啡的销售情形,影响咖啡销售量的因子有很多,例如口味、包装、价格、品牌等。 ????? 变异数分析的原理是这样的, 如果包装真的会影响销售量,那么各种包装的销售量的期望值应该是不同,则不以包装将样本分类而计算样本的变异,会比将样本分类后所得的变异大很多,因为前者除了包含了某一包装的销售量的变异,也包含了不同包装的销售量的平均值的变异,下面例子中你会知道可以用哪些统计量来描述这两个变异。分析过程计算部分可以透过程序PROC ANOVA得到相关的数据。   二、范例说明: 以下是一笔成衣工厂生产部门的工程师研究某种新的人造纤维的张力强度的影响是来自于棉花的成分的多寡,而我们将棉花占的比例分成15%、20%、25%、30%、35%五种,分别来看人造纤维的张力强度,我们列表如下: Weight Percent of Cotton Observed Tensile Strength (lb/in2) 1 2 3 4 5 15 7 7 15 11 9 20 12 17 12 18 18 25 14 18 18 19 19 30 19 25 22 19 23 35 7 10 11 15 11 ????? 资料来源:Douglas C. Montgomery Design And Analysis of Experiments pp63~64. 我们藉由变异数分析来探讨不同的棉花比例所造成的张力强度的差异,接着便是我们引进SAS中的程序PROC ANOVA来作为分析的工具。 三、分析概念: 在这里我们的问题是棉花的成分多寡是否会使人造纤维的强度不同,要将这个问题变成变成检定问题前我们需要一些假设: 首先所谓张力不同是指不同棉花比例所制造的人造纤维的张力的期望值不同,但是在不同比例所制造的人造纤维的张力的变异是差不多的,另外这些张力的测试值看来像是常态分布,如果这些假设显然不合理,那么就试试对资料做转换。我们以棉花含量来分组,并使用下列的符号: 若棉花比例多寡不会影响张力,则各组的期望值是一样的,各组平均数与母体平均数的误差为 0。在此我们使用变异数分析中的多重比较法(Multiple Comparison Method)来做说明,首先介绍均方误差(Mean Square of Error),其公式如下: 以我们所提的例子来做说明,棉花的比例有5种所以组数有五组(a=5),每组中有五个样本(n=5)及总数为25(N=25),SSE表示Error sum of squares 。从MSE的公式可以看出: MSE是一个变异数的估计量(不论各组的平均数是否相同)。接着开始进行组与组之间差异的检定,考虑如下的检定假设: 在虚无假设下我们可以将第 i 及第 j 组的观测值合并一起,因为虚无假设假设它们的mean相就像是来自同一母体,而下式 ??????????????????????????????? 就可用来估计变异数(在虚无假设下) ,因此如果上式比 MSE(只使用 i, j 两组资料计算 )大很多时,虚无假设就不甚合理,此时要考虑 Reject 虚无假设。以下便以SAS程序内容来做说明。   四、程序说明: 我们先介绍一下程序中所定义的变量部分,CO为棉花的比例、OBS为我们所观测到的张力强度,而在顺利的将资料读入后便是利用了程序PROC ANOVA来作分析,程序如下:(anova.sas) DM LOG;CLEAR;OUTPUT;CLEAR; DATA TENSILE; INPUT CO OBS @@; CARDS; 15 7 20 12 25 14 30 19 35 7 15 7 20 17 25 18 30 25 35 10 15 15 20 12 25 18 30 22 35 11 15 11 20 18 25 19 30 19 35 15 15 9 20 18 25 19 30 23 35 11 ; PROC ANOVA DATA=TENSILE; CLASS CO; MODEL OBS=CO; MEANS CO / LSD CLDIFF; RUN; 我们就是针对红色部分的内容做介绍。 ? (A)PROC ANOVA DATA=TENSILE 此行为说明对指定的资料(DATA=TENSILE)进行程序PROC ANOVA的分析。 ? (B)CLASS CO 此

您可能关注的文档

文档评论(0)

zhaoxiaoj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档