- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DMAIC_Training_Analyze__个人讲义
Phase II Analyze 2012.07.06 -- 07回顾:流程图帮助我们来找到X; 因果矩阵帮我们来减少X的数量,由几十个减少为5-10个,然后使用数据验证这些X对Y的影响.然后讲到数据本身来源要精确,这样MSA来帮助我们看数据来源是否准确.还有一个就是Capability,或者西格玛水平,用一个客观的方式来衡量改进前后的比较.数据分析的话,主要是根据X,Y变量的数据类型选择指示矩阵中的方法. 单一X 多数X X Data 离散X Data连续 X Data 离散X Data连续单一YY Data离散Chi-Square(卡方检验)Logistic Regression(逻辑回归) Multipile Logistic RegressionMultipile Logistic RegressionY Data 连续ANOVA(方差分析) Means/Medians Tests(t检验,Box plot)Regression 2,3,4 way AnovaMedians testsMultipile Regression多数YsMultivariate Analysis(Note:This is not Multi-Vari Studies)第1章卡方检验(X离散,Y离散,且都是一个变量)举例说明问题来源:人事部想了解年龄(old/young)与受聘之间的关联性.这里的Y是录用或者不录用,为离散数据类型;而X为Old/Young,也是离散的.或者是 Hire Not HireMail 50 100Female 25 50 24 51 23 52 ? ?这个差距到多少(数据为多少)我们认为差别大,就是说受聘与性别有关系?这里先提到一个假设检验:在Chi-Square独立性检验中,统计学家对大多数的变量皆假设为独立的,因此:H0:资料相互独立 (不相关)Ha:资料相互不独立 (相关)如果P值0.05,就拒绝H0.同时我们使用的所有软件假设录用不录用不受年龄影响,软件先定下原假设的结论就是默认无影响,原假设的P值0.9, 90%的可能性没有影响; p=0.1,10%的可能性没有影响,感觉上10%已经很小了,但是如果怀疑有影响,必须有足够的证据来证明有影响;因此我们觉得还是不够,只有到P值0.05,我们才觉得有足够的证据来拒绝原假设(不受影响),来说明有影响.也就是会所从保守(普通)的角度来考虑问题.这样我们想要知道年龄与受聘间是否独立假设如下:H0:年龄与受聘间是独立的(不相关)Ha:年龄与受聘间是不独立的(相关的)步骤1:把两个变量分成不同的level,并制作Observed Frequency Table (观察频率表):年龄: Old Young聘雇: Hired Not Hired, 然后收集数据资料并分析Hire Not Hire Mail 30 150Female 45 230步骤2:计算栏与列的总合步骤3:制作Expected frequency table (期望频率表),也就是说,如果这两个变量相互独立,表格应该是什么样的?下表右上步骤4:将实际观察值(Observed)减去期望值 / (Observed - Expected),上图右下.步骤5:将其差(O-E)平方,参考下左步骤6:计算相对的平方差(squared difference) = (O-E)^2/E,得到上右.用公式得到数值比0.005精确,把这四个数相加得到:Chi-squared = 0.0037+0.00074+0.0024+0.00048 = 0.0073.相对平方差之和为Chi Square分布.这里自由度 = (行数-1)x(列数-1) = (2-1)x(2-1)=1,也就是说这个分布是自由度为1的卡方分布,一旦自由度定下来,那么这个图形的胖瘦形状就定下来(注意任何自由度的卡方分布都是以0为起点).卡方值为0.0073右边的面积为P值, X轴为卡方值.面积的计算公式为=CHIDIST(卡方值,1), [注意这里1为自由度].得到面积为0.93, P=0.930.05,无法拒绝原假设,那就是独立(不相关).如果使用Excel来计算,方法如下:(参考Excel, Analyze.xls sheet “Chi-square”)如果更改一个数值,观察,参考Analyze sheet “eg1”得到0.000002, P0.05,则拒绝原假设,两者不独立,相关.分析的Roadmap如下:如果多一个X,则自由度会变化,其他还是类似:三个检验员, Walt为专职检验员, W
您可能关注的文档
最近下载
- 皮带硫化知识.doc VIP
- [紧固件]常用紧固件选型设计.pdf VIP
- 高速公路钢筋混凝土盖板涵首件施工方案.doc VIP
- 解读《GB_Z 44526 - 2024无损检测 操作能力鉴定》全面解读.docx VIP
- 本田GX630-660-690发动机维修手册.pdf VIP
- 2025四川成都东部集团有限公司及下属企业招聘产业招商等岗位94人笔试备考题库及答案解析.docx VIP
- (全国通用)01-2023年秋季高一入学分班考试模拟卷地理试题(解析版).docx VIP
- 20210129-中信建投-因子深度研究系列:高频订单失衡及价差因子.pdf VIP
- 发电厂检修规程.docx VIP
- 2024-2025学年度第二学期期末综合素质调研七年级英语试题(含听力材料及答案).docx
文档评论(0)