[工程科技]六西格玛绿带教程相关与回归.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工程科技]六西格玛绿带教程相关与回归

相关分析和回归分析 绿带培训教程   漏斗效应 相关分析和回归分析 因果矩阵分析 多变量分析 相关与回归分析 相关分析和回归分析 因果矩阵分析 多变量分析 相关与回归分析 相关分析和回归分析 因果矩阵分析 多变量分析 相关分析与回归分析 多变量分析 多变量图(Multi-Vari Chart):适用于连续型数据,描述变量间的关系 多变量图:直观地提供过程各影响因素之间的关系以及它们对过程输出影响的坐标图。六西格玛团队在研究多个变量时,可用多变量图形象地描述变量间的关系。这些图在方差分析等数据分析之前做,可以对数据有一些初步的形象了解。 多变量图 例:项目团队研究三种材料在某种条件下的时间效应。数据收集过程是在三个通电时间0.5,1.0,1.5分钟里分别测量每种材料(材料1,材料2和材料3)的5个样品,在进行数据分析前,了解是否有明显的趋势成交互作用。 多变量图 在输出的多变量图中,每一材料类型上都有连接三个点的连线,这三个点表示在对应的材料类型下,各个时间段里材料的超导强度的平均值,反映了各个材料类型组内的信息, 图中虚线连线上的各个点分别代表三种材料的超导强度的平均值,反映了各个材料类型组间的信息,它们虽有差别,但并不严重。 同种材料内分别对应的通电时间(通电时间分别为:0.5,1.0,2.0分钟)的超导强度差异较大,而且不同材料对应同样的通电时间的图象样子差别很大, 说明材料的种类与通电时间的长度有交互作用。 回归分析( Regression Analysis) 二类关系 相关系数 相关系数的检验 一元线性回归模型 回归方程的显著性检验 利用回归方程作预测 利用回归方程作控制 可化为线性回归的例子 两变量间关系 确定关系: 例:圆面积S与半径R 相关关系: 例:(1)儿子的身高与父亲的身高 (2)教育投资与家庭收入 (3)体重与身高 (4)合金钢强度与合金钢中的碳含量 因果关系: 例:发炎与发烧 例1 由专业知识知道,合金的强度y(×107Pa)与合金中碳的含量x(%)有关。为了生产强度满足用户需要的合金,在冶炼时如何控制碳的含量?如果在冶炼过程中通过化验得12组数据,列于下表中: 为解决这类问题就需要研究两个变量间的关系。 画散点图。为了研究两个量间存在什么关系,可以画一张散点图,具体见下图: 回归分析是研究一个随机变量y与另一些变量x1,x2,…,xk(普通变量或随机变量)之间关系的统计方法。 在某些问题中,诸x带有“原因”的性质,故称之为自变量。而y带有“结果”的性质,故称之为因变量。 有时x与y之间并无明显的因果关系,但仍沿用自变量与因变量的名称。 有时也称x为“因子”或“因素”,称y为“指标”或“响应”。 相 关 系 数(correlation coefficients) 散点图呈现上图的形状,即n个点基本在一条直线附近,但又不完全在一条直线上,我们希望用一个量来表示他们的密切程度,这个量称为相关系数,记为r,它被定义为: 可以证明有-1≤r≤1。 在合金钢的例子中可算得: 相关系数r 示意图与说明 相关系数r大小是表示两个变量x与y之间线性相关的程度。 当r=±1时,n个点在一条直线上,这时两个变量间完全线性相关。 当r0时,称两个变量间具有正相关,这时当x的值增加时,y的值也有增大的趋势。 当r0时,称两个变量间具有负相关,这时当x的值增加时,y的值有减少的趋势。 当r=0时,称两个变量不相关,这时散布图上n个点可能毫无规律,也可能两个变量间有某种曲线的趋势,也可能有新变量等待研究。 相关系数的检验 相关系数r为多大时,才能认为两个变量x与y间存在一定程度的线性相关呢?在正态分布假设下,对假设 H0:r=0 ,H1:r≠0 给出检验法则,其拒绝H0的拒绝域为: 其中n为样本量,α是显著性水平, 为自由度为n-2的r的 分位数,又称临界值,其数值有表可查。 譬如在合金钢例子中n=12,若取α=0.05,拒绝域为{|r|0.576},如今r=0.9705,可以显著性水平α=0.05认为,合金强度y与其碳含量x间存在线性关系。 一元线性回归模型 假定有两个变量: x是自变量,其值是可以控制或精确测量的,认为它的非随机变量。 y是因变量,对给定的x值,y的取值事先不确定,故y是随机变量。 假设(x,y)的散点图显示有直线关系,则我们可以认为观测值y由两部分迭加而成:一是随x的变化而呈线性变化的趋势,用β0+β1x表示;二是其它随机因素影响的总和,用ε表示,常设ε~N(0,σ2)。故有如下的

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档