方差分析的类型与计算方法.pptxVIP

下载本文档

34
0
约1.19万字
约 53页
2021-11-05 发布于江苏
举报
版权申诉

方差分析的类型与计算方法.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第7部分: (ANOVA) 第7部分: 方差分析 (ANOVA)目的:提供一种比较两个以上总体均值的客观方法。目标: 理解、应用和解释:单向ANOVA (单变量)平衡ANOVA (多变量)GLM (一般线性模型) 采用Minitab进行ANOVA/GLM分析什么是方差分析？用来确定因变量(“ Y”)与单个或多个自变量(“ Xs”)间关系的统计显著性的方法，其中(“ Xs”)具有两个或多个水平。是确定每一水平的响应变量值的均值是否来自同一总体的一种方法。(它们有所不同吗?)筛选潜在的关键少数“ Xs”的方法ANOVA适于自变量为离散变量、因变量为连续变量的情形。组间变差 (信号）? ANOVA的概念比较多个平均值的工具 (用于连续响应数据!)水平1水平2当前新工序间距总变差组内变差 (噪音)ANOVA确定不同水平的平均值间的差异(组间变差)是否大于各水平内部产生的变差(组内变差)的合理预期 …这就是其名字的来源组间信号比内部噪音大吗?平均SSbetween平均SSwithin是否记得第一阶段关于偏移与漂移的讨论?组间变差(信号) (?)总变差组内变差 (噪音) 信号ANOVA计算的比例:= 噪音 SS = 平方和 (变差的量度)是否记得t-检验? 在分析阶段，您已经学习了怎样使用“t检验”方法来比较两个样本平均值的差异。(是否记得“ 双样本” t-检验?)例:保险成本项目您怎样比较不同地区保险成本的平均值？五个地区的成本有差异吗?地区运作保险成本($K)平均值:方差分析(AVOVA)允许我们同时进行所有10项比较，从而控制着总体α风险...采用t检验进行多重比较的问题所有可能的 “ 双样本” t-检验问题:我们需要进行10次独立的比较以检验每对平均值。(AB, AC, AD, AE, BC, BD, BE, CD, CE, DE)即使所有平均成本都相同，仍有5%的机率来否定H0，并推断其中的一对平均值不相等。如果此检验步骤重复10次，错误地得出至少有一对平均值有差异结论的风险就会很高(比5%高得多)。ANOVA给出了同时比较五个平均值的单一假设检验。因素X有两个水平，40和150。因素“ X” 有两个水平(40和150)，但在此例中，150 水平有三个Y值，而40水平只有一个Y值。方差分析术语因素 - 自变量 (X)水平或设置 - 因素的离散值或因素的设置平衡数据 - 各因素不同水平的每一个组合都具有相等数量的样本或观测值。上例即为平衡数据，因为对于X的每个水平，都有两个观测值(响应变量Y值)。非平衡数据 - 各因素不同水平的每一个组合并非都具有相等数量的样本或观测值。方差分析的类型单向ANOVA: 单因素(“ X”)有两个以上水平 (设置)，以及一个连续的因变量 (Y) -确定因素水平如何影响总的响应变差。平衡ANOVA: 多个具有多水平的因素(两个以上“Xs”)、一个连续的因变量(“ Y”) - 确定每个因素对整个响应变差有多大影响。 GLM: 与平衡ANOVA相同，只是GLM具有非平衡数据。 DOE (试验设计): 在进行设计的试验中，确定各因素不同水平的哪些组合对响应变量的变差影响最大。运用ANOVA来回答这样一个问题：因素(“X”)水平对响应变量(“ Y”)的总变差有多大影响?使用方差分析的三种假设1. 对于因素水平的每一组合, 残差值的均值为0.0 这意味着我们所拟合的方程(或模型)正确，没有其它变量影响结果。 “ 观测” 值(圆圈)和“ 预计”值(数组平均值，水平线)间的差额为“ 残差”。假设 (续)残差必须独立，并呈正态分布残差(或误差)即是实际观测的“ Y”值和预计的数学模型的“ Y”值。残差表明模型何处与数据不相匹配。当比较平均值时，正态性往往不成问题。因为中心极限定理表明，平均值趋向正态分布。当比较变差时，正态性非常重要。(方差齐性：对于正态数据，应用“ Bartlett”检验法，对于非正态数据,应用“ Levene”检验法)2.假设 (续)3. 方差必须相等 (或接近相等) 另一个需要关注的问题(除平均值的相等性之外)是方差的相等性。“ X” 转变成不同水平时，可能降低变差，提高Z值。可以用Bartlett或Levene检验法来检验方差的相等性。I级II级间距?注:因素在水平II上的方差很大，掩盖了不同水平平均值之间真正的差异。水平 1当前粘合剂水平2配方A粘合剂水平3配方B粘合剂91214131821192116231815141715实际问题:一位开发工程师用一种特殊的粘合剂将两个部件粘在一起。另外还有两种可使用的粘合剂，但需要更高级的过程控制。如果其中的一种显示出平均抗剪强度不低于20，则值得更换粘合剂供应商、并改进过程控制水平。针对此例，运行Mini