- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于方差研究一种直觉推导及一个现实应用
关于方差研究一种直觉推导及一个现实应用摘 要:方差分析是一种重要的用于假设检验的统计方法,常用于分析和判断某一因素的不同水平对事物的影响是否有显著差异。虽然方差分析有非常广泛的应用,但不少统计方法应用者对方差分析中采用检验的原因并不清楚。而且,也很难发现有中外文献或资料对此原因做出解释。长期以来,检验统计量似乎已成为方差分析约定俗成的既定工具。文章从较为直观的视角,结合统计常识和基础知识,对方差分析中的检验统计量进行了较为充分的推导和证明。这种包含直觉成分的推导思路和过程很有可能与原有的推导有很大不同,但其一样有效地诠释了方差分析检验的机理和实质。
关键词:方差分析 检验 假设检验 理论推导 合并总体
中图分类号:F222 文献标识码:A
文章编号:1004-4914(2012)09-038-03
一、引言
方差分析是检验多个总体均值是否相等的统计方法。当要判断分类型自变量是否对数值型因变量有显著影响时,可以采用方差分析的方法。例如,要判断不同种化肥对农作物的产量是否有显著影响、不同生产工艺对产品的质量是否有显著影响、不同的培训项目对员工技能提高是否有显著影响等,都可以考虑通过方差分析对问题进行研究。
作为一种非常重要的检验方法,方差分析采用检验统计量进行显著性检验。虽然方差分析有非常广泛的应用,但不少的使用者并不十分清楚为什么采用检验进行方差分析。所见到的文献几乎都把方差分析中的检验仅作为一种统计工具予以介绍,而并不对方差分析中之所以采用检验的原因进行解释。笔者目前还没见到关于方差分析检验推导过程的中外相关文献或资料。
作为一种科学的统计检验方法,方差分析中采用检验统计量肯定有其非常严谨的推导过程,这是勿容置疑的。但或许正是由于其推导过程过于严格和复杂,从而鲜有文献资料对其给以说明和推证,只是把检验作为一种约定俗成的做法施加于方差分析过程。
本文笔者通过思考,尝试找到一种关于方差分析检验的推导方法。在整个推导过程中,所采用的都是一些基础性的统计知识,并掺插着对统计学问题的直觉认识。所以,笔者所采用的推导方法并不复杂,很容易让方差分析方法的使用者明白使用检验统计量的个中缘由。本文第二部分再现了这种推导过程。但有别于原本的方差分析推导过程所应具有的规范性和严谨性,本推导过程中的个别环节可能还值得进一步推敲。希望能与读者进行相关交流和探讨。本文的第三部分提供了一个用方差分析进行产品改良的商业案例,用以展现方差分析的具体过程和应用价值。
二、对方差分析检验统计量的直觉推导
(一)方差分析基本内容
方差分析是要判断分类型自变量是否对数值型因变量有显著影响。分类型自变量代表着某种影响因素或称为因子。影响因素以某一水平作用于若干个体对象上。所有可能被因素施以某一(水平)影响的个体构成一个相应的总体,而所观察到的受到因素某一(水平)具体影响的所有个体构成一个观测样本。这样,如果某一影响因素具有k个水平,意味着分类型自变量可以取k个不同的数值,因素k个水平下的观测值共构成k个对应样本。
若考察单一因素不同水平的影响,样本观测值的数据结构如下表1所示。影响因素第i水平下有ni个观测值,即第i个样本包含ni个个体。个体总数n=n1+n2+…nk。来自第i个总体(水平)的第j个观测值为xij。
根据以上数据结构,可以计算出如下统计量:因素各水平下观测值的均值xˉi、全部观测值的总均值x=、总误差平方和SST、组间误差平方和SSA、组内误差平方和SSE。在此基础上,还可以通过SSA和SSE分别除以各自的自由度,进一步计算出组间均方以MSA及组内均方MSE。
方差分析要根据k个样本提供的信息判断k个总体的均值是否相等。若k个因素水平所对应总体的均值分别为μ1,μ2,…,μk,则方差分析的原假设和备择假设可陈述为:
H0∶μ1=μ2…=μk H1∶μ1,μ2…,μk不全相等
对假设进行检验的统计量为:
F=■~F(k-1,n-k)
此为F统计量。其中,k-1和n-k分别为F分布的第一和第二自由度,并分别与SSA和SSE(或者说,与组间均方MSA、组内均方MSE的计算)相对应。
(二)F检验统计量推导过程
方差分析有三个基本假定:(1)每个总体都服从正态分布;(2)各个总体的方差相同;(3)观测值独立。在这些假定下,k个总体的分布如图1所示。
如果原假设“H0∶μ1=μ2…=μk”成立,则k个总体的分布完全相同,如图2所示。由k个总体合并一起构成的“合并总体”的分布等同于任一水平所对应总体的分布。用σ2E表示任一水平所对应总体的方差,σ2P表示k个总体构成的“合并总体”的方差,μP表示“合并总体”的均值,则由“μ1=μ2…=μk”可知:μP=μk,σ2P=σ2E。所以
文档评论(0)