何晓群《六西格玛数据分析技术》7.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国人民大学六西格玛质量管理研究中心 应用案例及变量分类 应用案例: 宝丽来公司的胶卷生产 食品连锁店关于餐馆季节性营业额与附近学生总数的回归分析应用 回归模型中的变量: 因变量或称响应变量y(Dependent Variable或Response) 自变量或称影响因素x(Independent Varible或Predictors) 返回目录 中国人民大学六西格玛质量管理研究中心 回归分析 一元线性回归 多元线性回归 非线性回归 回归分析和相关分析的联系和区别 1.理论和方法具有一致性; 2.无相关就无回归,相关程度越高,回归越好; 3.相关系数和回归系数方向 一致,可以互相推算。 1.相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量; 2.相关分析中x,y均为随机变量,回归分析中,只有y为随机变量; 3.相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。 返回目录 中国人民大学六西格玛质量管理研究中心 ut是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对y的影响。    et称为残差,在概念上, et与总体误差项ut相互对应; n是样本的容量。 a、b分别为α、β的样本估计值 (二)样本回归函数: (一)总体回归函数: 8.3 标准的一元线性回归模型 返回目录 中国人民大学六西格玛质量管理研究中心 8.4 一元线性回归模型的估计 2. 总体方差的估计      其中: 1. 回归系数的估计 根据实际数据,用最小二乘法,即使 ,分别对a、b求偏导并令其为零,求得两个标准方程:     联立求解得: 返回目录 中国人民大学六西格玛质量管理研究中心 8.5 一元线性回归模型的检验 回归模型检验的种类 回归模型的检验包括理论意义检验、一级检验和二级检验。 理论意义检验 统计一级检验 1.拟合程度的评价 2.回归模型的显著性检验 统计二级检验 返回目录 中国人民大学六西格玛质量管理研究中心 1.一元线性回归模型拟合优度的评价 判定系数(R2)是对回归模型拟合优度的评价。 总偏差 = 回归偏差 + 剩余偏差 x y 返回目录 中国人民大学六西格玛质量管理研究中心 2. 一元线性回归模型的显著性检验 回归系数b的检验: 1.提出假设。 H0:β=0;H1:β≠0 2.确定显著性水平α。 3.计算回归系数的 t 值。 4.确定临界值。 双侧检验查t分布表所确定的临界值是(-tα/2)和(tα/2);单侧检验所确定的临界值是(tα)。 5.做出判断。 返回目录 中国人民大学六西格玛质量管理研究中心 当样本量n30,用t 检验 当样本量n30,t分布接近于标准正态分布Z,所以可以用正态分布代替。 系数检验的方法选择: 返回目录 中国人民大学六西格玛质量管理研究中心 1.提出假设: H0:R2=0;H1:R2≠0 2.计算检验统计量 3.比较做出判断 回归模型整体的F检验 返回目录 中国人民大学六西格玛质量管理研究中心 零假设为假(续) 每个样本方差都给出 的一个估计,这个估计只与每个样本内部方差有关,若样本量相同,各个样本方差的算术平均值就是组内方差的估计值。 返回目录 中国人民大学六西格玛质量管理研究中心 前面已经讨论过,当零假设为真时, 的组间估计和组内估计应该很接近,即其比值应接近于1。而当零假设不成立时, 的组间估计将偏大,从而两者的比值会大于1,因此我们构造形如 检验统计量 F=组间方差/组内方差 的检验统计量,在一定的置信水平下,将这个 值和某个临界值作比较,就可以得出接受还是 拒绝零假设的结论。 返回目录 中国人民大学六西格玛质量管理研究中心 深入理解F统计量 F统计量实际上是用来比较组间差异与组内差异的大小,造成这种差别既有抽样的随机性,也可能包含系统因素的影响。 组间差异是用各组均值减去总均值的离差的平方再乘以各组观察值的个数,最后加总 组内差异则是各组内部观察值的离散程度 返回目录 中国人民大学六西格玛质量管理研究中心 深入理解F统计量(续) 上述组间差异与组内差异必须消除自由度不同的影响 对SSW,其自由度为n-g,因为对每一种水平,该水平下的自由度为观察值个数-1,共有g个水平,因此拥有自由度个数为 对SSB,其自由度

文档评论(0)

jinxuetong + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档