方差剖析的类型与计算方法.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7部分: 方差分析 (ANOVA) ;第7部分: 方差分析 (ANOVA);什么是方差分析?;组间变差 (信号)? ;是否记得第一阶段关于偏移与漂移的讨论?;在分析阶段,您已经学习了怎样使用“t检验”方法来比较两个样本平均值的差异。(是否记得“ 双样本” t-检验?) 例:保险成本项目 您怎样比较不同地区保险成本的平均值?五个地区的成本有差异吗?;我们需要进行10次独立的比较以检验每对平均值。(AB, AC, AD, AE, BC, BD, BE, CD, CE, DE) 即使所有平均成本都相同,仍有5%的机率来否定H0,并推断其中的一对平均值不相??。如果此检验步骤重复10次,错误地得出至少有一对平均值有差异结论的风险就会很高(比5%高得多)。;因素 - 自变量 (X) 水平或设置 - 因素的离散值或因素的设置 平衡数据 - 各因素不同水平的每一个组合都具有相等数量的样本或观测值。上例即为平衡数据,因为对于X的每个水平,都有两个观测值(响应变量Y值)。 非平衡数据 - 各因素不同水平的每一个组合并非都具有相等数量的样本或观测值。 ;方差分析的类型;使用方差分析的三种假设;假设 (续);假设 (续);实际问题:;数据组如下:;散点图 “ 图形胜过千言万语”;采用ANOVA证明统计显著性;x;g = 组数 (水平) n = 组中的样本数;如果总体平均值间没有差异,则计算得的F-比率应约为1.0 最后,将算出的F-比率与F表中列出的F值相比较。表中的F建立在样本容量和α风险之上(通常α=0.05)。如果F算出的>=F表中的, ,总体平均值间的差异具有统计显著性(您可以有95%的置信度相信差异不是偶然产生)。如果F算出的<F表中的,, 则您不会有95%的置信度认为总体平均值是不同的(它们可能在数值上不同, 但属同一整体的一部分---数字上的差异只是随机因素的结果)。 ;Minitab的ANOVA菜单选项;让我们用Minitab以粘合剂为例运行ANOVA;残差是因素某一水平的均值与观测值间的差异。针对此粘合剂实例,前7个残差的计算如下:;ANOVA会话窗口;采用Minitab的多因素ANOVA分析;首先 - 我们将数据制图;图形向我们显示什么信息?;查察数据的另一种方式…… 采用框图!;我们进行分析;残差图;ANOVA表的说明;额外的ANOVA表信息;下一步, 我们将分析残差。 我们分析残差是为了更多地了解工序, 并检验数学模型的“好坏”. 残差的一些特点: 残差的平均值将为0.0 残差应呈正态分布 残差应为随机分布 - 看不出模式或趋势 几种模式举例: 曲线 随时间而呈一定的趋势 不等变差 一个或两个极值 如果残差没有满足上述要求, 我们需要查寻原因。可能原因如下: 不准确的数据记录, 未包含所有重要‘Xs’ , 数据不呈正态分布。 使用图表来分析变化趋势。;残差直方图;残差与拟合值图;残差与变量对比图;在此例中,我们基于用于基准分析的数据(被动数据),用ANOVA 来筛选潜在的关键几个“ X” 。 这并不能证明这些“ Xs” 就是关键的! DOE( 设计的试验)就是用来证明“Xs” 是否真的关键。 ;如果没有平衡数据该怎么办?;以下是数集。 注意缺失的数据:;我们先观察图形 . . . 是否得出任何结论?;GLM分析...;在会话窗口中进行ANOVA分析;分析残差;课堂练习: 1) 打开下列工作表: L:6sigma\Minitab\training\Minitab\session 2\claims.mtw 2) 确定5个地区运作保险成本是否不同。 a) 首先“ 堆叠” 数据。将下标放于另一栏内。 b) 将数据制图 (散点图和框图) c) 运行ANOVA - 创建图形: 残差直方图 残差与拟合值图 当您看见“ 残差直方图” 时,注意它向右倾斜(右尾更长)。这意味着不符合ANOVA的正态假设。我们运行Box-Cox转换, 发现对数是一个适当的转换. 用成本的对数来再次运行此分析过程。 ; d) 在Minitab中创建一个新栏,即成本的对数(基 数10)。(Calc>Calculator并如图填写对话框) e) 将成本的对数作为“ Y” , 再次运行ANOVA 注意残差直方图不再向右倾斜。现在我们有了一个有效的ANOVA分析。;它检验什么? 两个以上变量的平均值或平均水平进行比较。 什么类型的数据 ? 类别或水平“ X” 数据(离散),及连续的“ Y” 响应变量值。Minitab能分析多达9个因素和50个响应变量值。 假设是什么? Ho :

文档评论(0)

capt + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档