- 39
- 0
- 约7.78千字
- 约 61页
- 2018-04-29 发布于河南
- 举报
统计学-第七章 方差分析
第七章 方差分析 主要内容 一、方差分析及其有关术语 二、方差分析的基本思想和原理 三、单因素方差分析 四、双因素方差分析 第一节 方差分析的一般问题 一、 什么是方差分析 通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著的影响。 单因素方差分析: 只涉及一个分类型自变量对数值型因变量的影响 双因素方差分析: 涉及两个分类型自变量对数值型因变量的影响 要分析品牌对空调的销售额是否有显著差异,可以判断4种品牌销售额的均值是否相等。 若它们的均值相等,就意味着不同品牌空调销售额无差异,即“品牌”对“销售额”没有显著影响; 若均值不全相等,则意味着“品牌”对“销售额”有显著影响。 但是这还不能提供充分的证据,因为平均销售额是根据随机样本的数值计算的,均值的差异可能是由于抽样随机性造成的。因此,需要有更准确的方法来检验这种差异是否是显著,就需要进行方差分析。 方差分析的有关术语 1.因素或因子 所要检验的对象称为因素或因子。 上例中,要分析品牌对销售额是否有影响,“品牌”是所要检验的对象——因素或因子。 2.水平或处理 因素的不同表现称为水平或处理。 品牌A、品牌B、品牌C、品牌D是“品牌”这一因素的具体表现,称为水平或处理。本例有四个水平。 3.观测值 每个水平下的样本数据称为观测值。 本例不品牌的销售额就是观测值 。 4.总体 因素的每一个水平可以看做是一个总体。 如品牌A、品牌B等。 5.样本数据 调查得到的数据可以看做从总体中抽取的样本数据。 本例各品牌的销售额即为样本数据。 二、方差分析的基本思想和原理 要分析品牌对空调的销售额是否有显著差异,可以判断4种品牌销售额的均值是否相等。 若它们的均值相等,就意味着不同品牌空调销售额无差异,即“品牌”对“销售额”没有显著影响; 若均值不全相等,则意味着“品牌”对“销售额”有显著影响。 但是这还不能提供充分的证据,因为平均销售额是根据随机样本的数值计算的,均值的差异可能是由于抽样随机性造成的。因此,需要有更准确的方法来检验这种差异是否是显著,就需要进行方差分析。 从上表中可以看出,各品牌的平均销售额不同,但这还不能提供充分的证据证明品牌对销售额有显著的影响,因为这种差异也可能是由于抽样的随机性所造成的。 在判断均值之间是否有差异时需借助于反映变异程度的指标——方差,所以叫方差分析。 这个名字也表示:它是通过对数据误差来源的分析,来判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源。 关于误差 组内误差(随机误差) 同一水平(总体)下样本各观察值之间的差异 这种差异可以看成是随机因素的影响,称为随机误差 组间误差(随机误差、系统误差) 不同水平(总体)下各观察值之间的差异 这种差异可能是由于抽样的随机性所造成的——随机误差,也可能是由于品牌本身所造成的,称为系统误差 两个误差的比值 若品牌对空调销售额没有影响,则组间误差中只包含随机误差,没有系统误差。这时,组间误差与组内误差的比值就会接近1; 若品牌对空调销售额有影响,在组间误差中除了包含随机误差外,还会包含有系统误差,这时它们之间的比值就会大于1; 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响。 三、方差分析的基本假定 1.观测值是来自于服从正态分布总体的随机样本 2.各总体的方差相同。 3.各总体相互独立。 四、方差分析的基本步骤 第一步:提出假设 第二步:构造检验统计量F 第三步:查表得Fα,进行统计决策(右侧检验) 若FF?,则拒绝原假设 若FF?,则不能拒绝原假设 第二节 单因素方差分析 要点: 一、数据结构 二、分析步骤 三、关系强度 四、Excel的应用 一、数据结构 二、分析的步骤 1.提出假设 2.构造并计算检验统计量 3.统计决策 1.提出假设 一般提法 H0: m1 = m2 =…= mk 自变量对因变量没有显著影响 H1: m1 ,m2 ,… ,mk不全相等 自变量对因变量有显著影响 注意:备择假设并不意味着所有的均值都不相等 2.构造并计算检验统计量 均值:各水平的均值、全部观察值的均值 组内误差平方和: 组间误差平方和: 总误差平方和: 三个平方和的关系 SST =SSA+SSE 即 总平方和=组间平方和+组内误差平方和 方差MS 各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差 计算方法是用误差平方和除以相应的自由度 三个平方和对应的自由度分别是 SST 的自由度为n-1,n为全部观察值的个数 SSA的
原创力文档

文档评论(0)