统计学第10章方差精编.doc

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE  PAGE 24 第10章 方差分析 适用:多个均值是否相等的检验(分类数据与数值型数据) 10.1 方差分析引论 例 消费者与产品生产者、销售者或服务的提供者 之间经常发生纠纷。当纠纷发生后,消费者通常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了一些 企业作为样本。其中零售业7家、旅游业6家、航空公司5家、家电制造业5家。每个行业所抽取的这些企业,假定他们在服务对象、服务内容、企业规模等方面基本相同。然后统计最近一年中消费者对这23家企业的投诉次数,结果如下表: 零售业旅游业航空公司家电制造4457683151663949654929217740453458345640535144消费者协会想了解这几个行业之间的服务质量是否有显著性差异。 10.1.1 分析 服务质量 显著性差异 投诉次数 均值不相等 转化为数学表达: 没有显著性差异 上面的等式不全相等 有显著性差异 一般假设检验的解决方法: 更好的方法:方差分析 没有显著性差异不同的行业服务质量一样,行业对服务质量没有显著影响 有显著性差异不同的行业服务质量不一样,行业对服务质量有显著影响 从行业对服务质量影响的角度来分析平均服务质量的差异问题 术语: 因素:一个独立的随机变量,是方差分析研究的对象———— 企业所属行业类型 水平:因素的内容————各个行业: 零售业、旅游业、航空公司、家电制造 10.1.3 方差分析的原理: 1 观察值之间差异的原因 A 由于选取样本的随机性引起的差异 B 由于因素中的不同水平形成的差异——系统性差异 (行业不同,服务质量不同) 2 水平内部与水平之间差异的类型 A 水平内部的差异 只包含随机性差异 (同行业企业服务质量的差异) B 水平之间的差异 既包含随机性差异又包含系统性差异 (不同行业企业服务质量的差异) 3 原理 如不同的水平对结果没有影响 则水平之间的差异应只包含随机性差异 与水平内部的差异应该非常接近 反之 如不同的水平对结果产生影响 则水平之间的差异应既包含随机性差异又包含系统性差异 应该大于水平内部的差异 所以,可以通过比较这两个差异的大小 当比较的结果大于某个临界值时,就可以判定水平之间包含系统性差异, 即水平对结果有显著影响——均值不全相等 10.1.4 技术问题 选择什么样的指标来衡量这两个差异与比较的结果 差异:离散——离差平方和 差异的比较:差、商——考虑统计量的分布与临界值 方差分析的基本假定 ① 每个总体都服从正态分布,即对于因素的每一个水平,其观测值都是来自正态总体的简单随机样本; ② 各个总体的方差相等 ③ 观测值是独立的 ——独立等方差的正态总体 实际应用中近似满足即可 10.2 单因素方差分析 单因素方差分析:分析只针对一个因素进行 企业类型 双因素方差分析:分析针对两个因素进行 企业类型 企业文化 10.2.1分析步骤 1 提出假设 因素(自变量)对结果(因变量)没有显著性差异 不全相等 自变量对因变量有显著性差异 上例: 不同行业对服务质量没有显著性差异 上面的等式不全相等 不同行业对服务质量有显著性差异 2 计算均值 ① 计算各样本的均值 设从第个总体中抽取一个样本容量为的简单随机样本, 令为其均值,则 其中,为第个总体的第个观察值 为因素水平的个数(总体的个数) 上例:, ,, ②计算全部观测值的总均值 上例: 3计算各误差平方和 A 组内平方和 是每个水平或组的各样本数据与其组均值误差的平方和 反映了各个样本观测值的离散状况 上例: B 组间平方和 是各组均值与总平均的误差平方和 反映各组的差异 上例: C 总平方和 是全部观测值与总平均的误差平方和 上例: 4计算统计量 定理: 当各总体满足方差分析的三个基本假设时,有 ,相互独立 且 当成立时, 所以,为了检验 取检验统计量为 上例: 5统计决策: 大于 拒绝原假设 —————— 右单侧检验 所以 当 ,拒绝原假设 当 ,不能拒绝原假设 上例: 临界值 因为3.413.13, 所以拒绝原假设,即认为服务质量均值有显著性差异,行业类型对服务质量有显著性影响。 方差分析表 误差来源平方和自由度均方值值临界值组间(因素影响)SSAk-1MSAMSA/MSE

文档评论(0)

贪玩蓝月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档