- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
怎样解决下面的问题? 来自不同地区的大学生每个月的平均生活费支出是否不同呢? 家电的品牌对它们的销售量是否有显著影响呢? 不同的路段和不同的时段对行车时间有影响吗? 超市的位置和它的销售额有关系吗? 不同的小麦品种产量有差异吗? 为什么我们要学习方差分析 为什么我们要学习方差分析 研究分类自变量(因子factor)对数值因变量(观测结果)的影响 例如:“化肥品牌”是一个分类自变量 两个或多个 水平(level)或分类。例如:3个化肥品牌 一个数值型因变量,产量 分析三个品牌的化肥的产量是否有显著差异,也就是要判断“品牌”对“产量”是否有显著影响 作出这种判断最终被归结为检验这三个品牌的产量的均值是否相等 若它们的均值相等,则意味着“品牌”对产量是没有影响的;若均值不全相等,则意味着“品牌”对产量是有影响的。 为什么我们要学习方差分析 可以用假设检验吗? 两两比较三种品牌的产量均值是否存在差异。 用t分布比较3组总体均值,需要进行3次不同的t检验。 如果显著性水平设为0.05,那么正确判断的概率为0.95。因为我们分别进行3次独立的检验,任何一次检验都不做错误判断的概率为:P(都正确)=0.953=0.8574 因此,至少一次错误的概率为1-0.8574=0.1426。总之,如果我们用t分布分别做3次独立的检验,至少有一样本错误发生的概率从0.05上升到了0.1426。 方差分析基本原理 方差分析的基本思想和原理(图形分析) 从散点图上可以看出 不同品牌的产量是有明显差异的 同一个品牌,不同地块的产量也明显不同 B较高,C较低 品牌与产量之间有一定的关系 如果品牌与产量之间没有关系,那么它们的产量应该差不多相同,在散点图上所呈现的模式也就应该很接近 方差分析的基本思想和原理 仅从散点图上观察还不能提供充分的证据证明化肥品牌与小麦产量之间有显著差异 这种差异也可能是由于抽样的随机性所造成的 需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析 所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差 这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源 误差分解 组内误差(within groups) 样本数据内部各观察值之间的差异 比如,同一位置下不同超市之间销售额的差异的差异 反映随机因素的影响,称为随机误差 组间误差(between groups) 不同样本之间观察值的差异 比如,不同位置超市之间销售额的差异 可能是随机误差,也可能是超市位置本身所造成的系统性系统误差 总误差(total) 全部观测数据的误差大小 方差分析的基本原理(误差分解) 误差平方和的分解及其关系 误差度量(均方—MS) 用均方(mean square)表示误差大小,以消除观测数据的多少对平方和的影响 用平方和除以相应的自由度 均方也称方差(variance) 组间均方也称组间方差(between-groups variance),反映各因子间误差的大小 MSA=SSA÷自由度(因子个数-1) 组内均方也称组内方差(within-groups variance) ,反映随机误差的大小 MSE=SSE÷自由度(数据个数-因子个数) 总平方和(SST)的自由度为n-1 方差分析的基本原理(误差分析) 判断原假设是否成立,就是判断组间方差与组内方差是否有显著差异 若原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近1 若原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,即自变量对因变量有影响 误差分析(F-检验) 将组间均方与组内均方进行比较,分析差异是否显著 F=(MSA÷MSE)~F(因子自由度,残差自由度) 用F分布作出决策,给定的显著性水平? 若FF?(或P?) ,则拒绝原假设H0 ,表明均值之间的差异显著,因素对观察值有显著影响 误差分析(F分布与拒绝域) 单因素方差分析 设?1为化肥品牌A下产量的均值,?2为化肥品牌B下产量的均值,?3为化肥品牌C下产量的 提出的假设为 H0 : ?1 ? ?2 ? ?3 H1 : ?1 , ?2 , ?3 不全相等 计算检验统计量 计算P值,作出决策 单因素方差分析表(基本结构) 用Excel进行方差分析 (Excel检验步骤) 第1步:选择“工具 ”下拉菜单 第2步:选择“数据分析 ”选项 第3步:在分析工具中选择“单因素方差分析 ” ,然 后选择“确定 ” 第4步:当对话框出现时 在“输入区域 ”方框内键入数据单元格区
您可能关注的文档
- 北京工业大学土木工程概论课件第7章 水工结构工程.ppt
- 北京工业大学土木工程概论课件第10章 建设项目管理及土木工程经济.ppt
- 北京工业大学土木工程概论课件第11章 土木工程防灾减灾.ppt
- 北京工业大学土木工程概论课件第12章 计算机在土木工程中的应用.ppt
- 北京工业大学土木工程概论课件第13章 土木工程职业注册制度及职业资 格证书.ppt
- 北京工业大学自动控制原理课件第八章 采样控制系统分析基础1.ppt
- 北京工业大学自动控制原理课件第八章 采样控制系统分析基础2.ppt
- 北京工业大学自动控制原理课件第二章 控制系统的数学描述方法1.ppt
- 北京工业大学自动控制原理课件第二章 控制系统的数学描述方法2.ppt
- 北京工业大学自动控制原理课件第六章 控制系统的校正方法2.ppt
文档评论(0)