[第四讲方差分析.pptVIP

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[第四讲方差分析

商学院 李丽明 第四讲 方差分析 寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即是有关与无关。 在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。 分类数据 分类变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用分类或顺序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对分类数据的描述和分析通常使用列联表 可使用???检验 双变量关系的统计类型 一、方差分析 1、分组平均数比较的含义 当一个变量为定类变量,另一变量为定距变量时,两变量间是否有关,通常以分组平均数比较的方法来考察。即按照定类变量的不同水平来分组,看每个分组的定距变量的平均数是否有差异。不同组间的平均数差异越小,两个变量间的关系越弱;相反,平均数差异越大,变量间关系越强。 2、定类—定距变量的关系强度测量 定类变量和定距变量的关系强度测量采用F统计的方法,即方差分析。 3、什么是方差分析(ANOVA)? (analysis of variance) 检验多个总体均值是否相等 通过分析观察数据的误差判断各总体均值是否相等 研究分类型自变量对数值型因变量的影响 一个或多个分类尺度的自变量 2个或多个 (k 个) 处理水平或分类 一个间隔或比率尺度的因变量 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量 什么是方差分析? (例题分析) 什么是方差分析? (例题分析) 分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响 作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等 如果它们的均值相等,就意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异 方差分析中的有关术语 因素或因子(factor) 所要检验的对象 要分析行业对投诉次数是否有影响,行业是要检验的因素或因子 水平或处理(treatment) 因子的不同表现 零售业、旅游业、航空公司、家电制造业就是因子的水平 观察值 在每个因素水平下得到的样本值 每个行业被投诉的次数就是观察值 方差分析中的有关术语 试验 这里只涉及一个因素,因此称为单因素四水平的试验 总体 因素的每一个水平可以看作是一个总体 比如零售业、旅游业、航空公司、家电制造业可以看作是四个总体 样本数据 被投诉次数可以看作是从这四个总体中抽取的样本数据 单因素方差分析的数据结构 提出假设 一般提法 H0: m1 = m2 =…= mk 自变量对因变量没有显著影响 H1: m1 , m2 ,… , mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 构造检验的统计量 (三个平方和的关系) ?总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系 统计决策 ? 将统计量的值F与给定的显著性水平?的临界值F?进行比较,作出对原假设H0的决策 根据给定的显著性水平?,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k 相应的临界值 F? 若FF? ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响 若FF? ,则不拒绝原假设H0 ,不能认为所检验的因素对观察值有显著影响 或用P值决策,若P ?,则拒绝原假设H0 ,否则不能拒绝原假设H0 。 案例6-1 二、单因素的进一步分析 多重比较检验 双因素方差分析 分析两个因素(行因素Row和列因素Column)对试验结果的影响 如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分析(Two-factor without replication) 如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素方差分析 (Two-factor with replication ) 双因素方差分析的基本假定 每个总体都服从正态分布 对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本 各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的 观察值是独立的 双因

文档评论(0)

tiantiande + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档