ANOVA数据转换讨论.docVIP

下载本文档

10
0
约1.04万字
约 7页
2016-06-29 发布于安徽
举报
版权申诉

ANOVA数据转换讨论.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

ANOVA数据转换讨论.doc

利用ANOVA进行单因素方差分析时，如果不同水平的方差差异较大时，如何处理，还能使用ANOVA吗？如果不能，还有什么方法供选择？我的意见是，尽量给方差一个合理的model——事实上，常见的变换都是由model推导出来的，比如log或者更一般的power transformation，实际上是根据方差是均值的幂这个model得到的。但是有很多情况下，方差不齐意味着均值的比较有时候根本就不合理（数学上显然没有什么不合理，但实际解释中经常不是我们真正需要的东西）。当你在应用ANOVA分析的时候，你对你的数据是要做３个基本假定：（１）各观测值之间独立；（２）它们都是正态分布；（３）它们之间有同方差。除了第一个假定是依据数据和实验性质来回答，后面２个都要通过检验来确定。如果数据不是正态分布的，你能处理的方式只有２个：将数据转换正态分布，或是只能用非正态分布的方法（比如说非参数法）。齐方差检验也是一个道理，你如果用了各种转换，还是达不到效果，ANOVA肯定就是失效了，所以你必须寻求其他的解法。比如说，你仍然假定各个观测值是正态的，但各组的方差不同情况下比较均值（Abel提出的GARCH模型可否处理这个问题？）；或是你干脆什么分布都不假定，直接用Rank来进行非参数分析。 I think this is probably a misunderstanding. It might be true mathematically, but its NEVER true in practice. There is nothing normally distributed in this real world. Normality is simply an abstract concept in mathematics. ANY real data set will fail in some of the mathematical assumptions or other. The goal is not to find a perfect mathematical model, but to find a useful model that guides our appreciation about the nature. To this end, the problem is not to identify whether the assumptions fail - as it always fails - but to identify how much the failure of assumptions affect our appreciation on the world. As long as it is mild or it only affects some aspect(s) of the model that are not of particular interest to us, it IS a useful model. 哈，这又回到了如何看待这个“it is mild or it only affects some aspect(s) of the model”了。如果已经经过了多种转换的测试，homogeinity test仍然通不过，我与其死守住这个“useful”的ANOVA model，还不如用其他的方法来的跟更稳健（robust）一些。任何假定都不可能满足的，稳健又怎么样？最后还不是用大样本性质么？可是什么是大样本，只有无穷大的样本才是数学意义上真正的大样本。在实际应用不是照样不可能的？那么稳健的假定不是又不满足了？方差齐性检验我以前在另外一个帖子里面说过了，就我所检查过的检验方法中，根本就没有一个既能在数学上满足要求，又能在实际中广泛应用的。normality检验也是同样。退一万步说，就算什么检验都通过了，又能怎么样？通过那些检验也照样没法说明假定就满足了，因为检验的原假设是最终想要接受的东西，而且是一个simple hypothesis，所以数学上严格意义的这种检验根本就不存在。稍微理想一点点的检验是做equivalence test，可是这个时候还是要确定多大程度的方差不齐是可以接受的——还是一个样，多大程度的assumption violation是可以接受的。所以，诸如此类的检验只能充其量提供那么一点点参考信息而已。数据转换永远是最后的选择。盲目的尝试什么转换好，远不如根据数据性质来给定方差的模型，前面已经说过，任何转换都是根据模型得到的。现在到了讨论统计分析对试验结论的可能性贡献问题。是呀，到底这些统计上的检验通过或是失败了，对试验最后的结论有多大的影响力作用呢？试验者关心的