- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
六西格玛培训-分析阶段.ppt
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 二元逻辑回归 二元逻辑回归BLR 在多元回归(Multiple Regression)中,我们介绍了 通用线性模型(General Linear Model),用于分析 X有连续型的也有非连续型的数据 GLM是一种数学模型,以Xs的线性组合来解释Y 逻辑回归是GLM的一部分 回归 逻辑 最小平方 GLM ANOVA 二元逻辑回归 计算倍率 Odds Ratio 例如:我们要检查有工作压力/没有工作压力与患心脏病/不患心脏病的倍率关系 Yes (1) No (0) Yes (1) 97 200 No (0) 307 1409 X = 工作压力? 倍率Odds Ratio – 是X=1与X=0的比率 Ψ = 97 / 307 = 2.2 200 / 1409 存在吗? 因此,有工作压力患心脏病的几率是没有工作压力患心脏病的几率的2.2倍 二元逻辑回归 BLR例子 某GB收集了航空发动机复合叶片的数据,如表 一个X是叶片的类型 VaneType(用1,2,3来表示)(离散) 另一个X是KitWght叶片的重量(连续) 它的Y是区分的数据(1表示无缺点,2表示有缺点)C-Scan(离散) 二元逻辑回归 评价叶片类型Vane Type 比较叶片类型2与类型1;因为P=0.174,所以倍率关系不成立 比较叶片3型与1型,3型叶片是1型叶片产生缺陷机会的4.86倍;因为P=0.002所以这种关系成立 二元逻辑回归 注意置信区间 当95%的置信区间夹了1,就表示倍率odds ratio可能比1大,也可能比1小,因此倍率不确定;表示倍率不存在(此时P值必大于0.05) 二元逻辑回归 注意置信区间 1型与2型比 3型与2型比 结论:3型与1型、3型与2型的叶片对缺陷存在 比例关系,1型与2型无不同 二元逻辑回归 比较基准 注意: 在输出的Session窗口中,虽然叶片总共有3种类型,但每次只有两种叶片类型的信息出现。这是因为将一种类型(一个因素的某个水平)作为比较的基准,Minitab通常将因素X最小数表示的水平作为比较的基准,如下例是默认“1型”的叶片作为比较基准。 在解释输出时,Minitab并不给出非基准的因素之间的P值。 二元逻辑回归 卡方检验结果 P=0.0030.05,表示3种类型至少有一种类型的叶片对缺陷的影响不同。 从逻辑回归分析,可以知道哪些类型的叶片有不同 二元逻辑回归 使用连续型数据 Y – C-Scan X – 叶片重量:KitWght 二元逻辑回归 连续X的输出 β0 β1 二元逻辑回归 Coef系数的重要性 二元逻辑回归 画p(d)与X的散点图 增加了一列数据EPR01 二元逻辑回归 解释 叶片重量 注:EPR01实际含义与Y设定的最大值的含义相对应 二元逻辑回归 吻合度检验 二元逻辑回归 吻合度检验的解释 这种检验比较可靠 Ho:模型输出与观测数据一致 Ha:模型输出与观测数据不一致 二元逻辑回归 摘要 二元逻辑回归BLR是用来分析Y是离散型数据, 而X既有离散的x又有连续的x BLR比卡方检验能有更详细的信息,卡方检验 只能提供所有数据的情况,而BLR可以得到两两 之间的比较结果 分析工具参考 分析阶段工具 谢 谢 ! * * * * * * * * * * * * * 简单线性回归 相关是强还是弱? SS 651434 7312027 7963461 R2描述了X可以解释Y 的变化达到多少百分比 (是由这个X造成的) R2=SS /SS R2在0% -- 100%之间 Regression Total R2=SS /SS Regression Total 这:R2=651434/7963461 = 8.2% R2越接近100%,表示选定的X对Y解释的越多 简单线性回归 R2和R2 (adjusted) 500 1000 1500 500 0 1000 如果误差Error越小,数据点就越 接近直线,R2也越大(接近1) 由于SS = SS + SS 因此误差越大,R2越小 对于多个
原创力文档


文档评论(0)