方差分析的类型与计算方法.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7部分: (ANOVA) 第7部分: 方差分析 (ANOVA)目的:提供一种比较两个以上总体均值的客观方法。目标: 理解、应用和解释:单向ANOVA (单变量)平衡ANOVA (多变量)GLM (一般线性模型) 采用Minitab进行ANOVA/GLM分析什么是方差分析?用来确定因变量(“ Y”)与单个或多个自变量(“ Xs”)间关系的统计显著性的方法,其中(“ Xs”)具有两个或多个水平。是确定每一水平的响应变量值的均值是否来自同一总体的一种方法。(它们有所不同吗?)筛选潜在的关键少数“ Xs”的方法ANOVA适于自变量为离散变量、因变量为连续变量的情形。组间变差 (信号)? ANOVA的概念比较多个平均值的工具 (用于连续响应数据!)水平1水平2当前新工序间距总变差组内变差 (噪音)ANOVA确定不同水平的平均值间的差异(组间变差)是否大于各水平内部产生的变差(组内变差)的合理预期 …这就是其名字的来源组间信号比内部噪音大吗?平均SSbetween平均SSwithin是否记得第一阶段关于偏移与漂移的讨论?组间变差(信号) (?)总变差组内变差 (噪音) 信号ANOVA计算的比例:= 噪音 SS = 平方和 (变差的量度)是否记得t-检验? 在分析阶段,您已经学习了怎样使用“t检验”方法来比较两个样本平均值的差异。(是否记得“ 双样本” t-检验?)例:保险成本项目您怎样比较不同地区保险成本的平均值?五个地区的成本有差异吗?地区运作保险成本($K)平均值:方差分析(AVOVA)允许我们同时进行所有10项比较,从而控制着总体α风险...采用t检验进行多重比较的问题所有可能的 “ 双样本” t-检验问题:我们需要进行10次独立的比较以检验每对平均值。(AB, AC, AD, AE, BC, BD, BE, CD, CE, DE)即使所有平均成本都相同,仍有5%的机率来否定H0,并推断其中的一对平均值不相等。如果此检验步骤重复10次,错误地得出至少有一对平均值有差异结论的风险就会很高(比5%高得多)。ANOVA给出了同时比较五个平均值的单一假设检验。因素X有两个水平,40和150。 因素“ X” 有两个水平(40和150),但在此例中,150 水平有三个Y值,而40水平只有一个Y值。方差分析术语因素 - 自变量 (X)水平或设置 - 因素的离散值或因素的设置平衡数据 - 各因素不同水平的每一个组合都具有相等数量的样本或观测值。上例即为平衡数据,因为对于X的每个水平,都有两个观测值(响应变量Y值)。非平衡数据 - 各因素不同水平的每一个组合并非都具有相等数量的样本或观测值。方差分析的类型 单向ANOVA: 单因素(“ X”)有两个以上水平 (设置),以及一个连续的因变量 (Y) -确定因素水平如何影响总的响应变差。 平衡ANOVA: 多个具有多水平的因素(两个以上“Xs”)、一个连续的因变量(“ Y”) - 确定每个因素对整个响应变差有多大影响。 GLM: 与平衡ANOVA相同,只是GLM具有非平衡数据。 DOE (试验设计): 在进行设计的试验中,确定各因素不同水平的哪些组合对响应变 量的变差影响最大。运用ANOVA来回答这样一个问题:因素(“X”)水平对响应变量(“ Y”)的总变差有多大影响?使用方差分析的三种假设1. 对于因素水平的每一组合, 残差值的均值为0.0 这意味着我们所拟合的方程(或模型)正确,没有其它变量影响结果。 “ 观测” 值(圆圈)和“ 预计”值(数组平均值,水平线)间的差额为“ 残差”。假设 (续)残差必须独立,并呈正态分布残差(或误差)即是实际观测的“ Y”值和预计的数学模型的“ Y”值。残差表明模型何处与数据不相匹配。 当比较平均值时,正态性往往不成问题。因为中心极限定理表明,平均值趋向正态分布。当比较变差时,正态性非常重要。(方差齐性:对于正态数据,应用“ Bartlett”检验法,对于非正态数据,应用“ Levene”检验法)2.假设 (续)3. 方差必须相等 (或接近相等) 另一个需要关注的问题(除平均值的相等性之外)是方差的相等性。“ X” 转变成不同水平时,可能降低变差,提高Z值。可以用Bartlett或Levene检验法来检验方差的相等性。I级II级间距?注:因素在水平II上的方差很大,掩盖了不同水平平均值之间真正的差异。水平 1当前粘合剂水平2配方A粘合剂水平3配方B粘合剂91214131821192116231815141715实际问题:一位开发工程师用一种特殊的粘合剂将两个部件粘在一起。另外还有两种可使用的粘合剂,但需要更高级的过程控制。如果其中的一种显示出平均抗剪强度不低于20,则值得更换粘合剂供应商、并改进过程控制水平。针对此例,运行Mini

文档评论(0)

189****5087 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7102116031000022
认证主体仪征市思诚信息技术服务部
IP属地江苏
统一社会信用代码/组织机构代码
92321081MA278RWX8D

1亿VIP精品文档

相关文档