- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 常用统计技术 相关分析与回归分析.ppt
* 第二 章 常用统计技术第四节 相关分析与回归分析 问题的提出:在质量管理中还需要研究两个变量的相关关系,而回归分析是处理相关关系的一种统计技术。主要对象是定量因子,即变量。 一、 相关分析 (一) 相关关系的概念 两个变量间存在三种关系:确定性关系、相关关系和不相关关系。 确定性关系: y=f(x),X与Y 一 一对应 相关关系:即变量之间虽然存在着密切的关系,但从一个(或一组)变量的每一确定值,不能求出另一变量的确定值。可是在大量试验中,这种不确定的关系又具有某种统计规律性。 (二)相关关系的种类 1、按研究变量(或因素)的多少可分为一元相关(也称单相关)和多元相关(也称复相关)。 2、按变量之间相互关系的表现形式不同分为线性相关(也称直线相关)和非线性相关(也称曲线相关)。 3、按变量变化的方向不同分为正相关和负相关。当值增加时,之值也相应地增加,这种相关关系称为正相关。 4、按变量之间的相关程度分为完全相关 、不完全相关 和不相关 ,r为相关系数。 (三)散布图 1、为了研究两个变量之间存在什么关系,可以通过散布图表示, 把每一对(x,y)看成是横坐标为X纵坐标为Y的直角坐标系 的一个点,再图中标出个点,构成了散布图。从图中可见两个 变量间确实存在一定的关系。 散布图也是用来分析研究两个对应变量之间是否存在相关关系的一种作图方法。它通过将两种对应的变量的数据用点绘在x—y平面上,能大概掌握两个变量之间是否有关联及关联的程度如何。 2、散布图的制作方法 1)收集成对的数据(x1,y1),(x2,y2),…整理成数据表。 2)找出x,y的最大值及最小值。 3)以x,y的最大值及最小值建立xy坐标系,并决定适当刻度便于绘点。 4)将数据依次点于xy直角坐标系中,两组数据重复时以*表示,三组及以上数据重复时以☉表示。 5)必要时,可将相关资料注记在散布图上。 注意事项。 ⑴ 是否有异常点。有异常点时,不可任意删除该异常点,除非异常的原因已确实掌握。 ⑵ 是否需分层。数据的获得常常因为操作人员、方法、材料、设备或时间等的不同,而使数据的关联性受到扭曲。 a.? 全体数据低度关联,分层后高度关联。 b. 全体数据高度关联,分层后低度关联 3、散布图的判读 1)强正相关,见图 (a); 2)弱正相关,见图 (b); 3)强负相关,见图 (e); 4)弱负相关,见图 (f); 5)不相关。x与y无明显规律,见图 (c); 6)非线性相关。x与y呈曲线变化关系,见图 (d) 2、相关系数的显著性检验 二、 回归分析 (一)问题的提出 回归这个词是英国科学家高尔顿用来描述遗传变化现象的。高尔顿通过大量的研究发现,身高高的父母比矮的父母倾向于生育高的子女,但从平均身高看,父母高,他们的子女一般并不象他们那样高,父母矮,他们的子女一般并不象他们那样矮。父母个高或个矮在遗传学上有趋于一般的现象,这种现象便叫做回归 。 回归分析的定义 (GB/T?3358)? 为建立拟合模型,通过优化目标函数来估计拟合模型参数,并对其进行适当的假设检验。利用拟合好的模型作统计计预报的一种方法 。 回归分析主要讨论以下三方面内容: 1.从一组数据出发确定变量之间近似的定量关系式; 2.对所得关系式的精度(可靠度、可信度)进行检验; 3.利用这种关系式对生产或经营过程进行预测或控制。 (二) 一元线性回归方程 1、一元线性回归模型概述 回归分析是研究自变量与因变量之间变动关系的一种数理统计方法。根据观测数据,通过回归分析,可以求出一定的关系式,称为回归方程式;回归方程式确定后,可以根据自变量的数值推测因变量之值。 回归方程式如果是线性的,就称为线性回归方程式,否则就称为非线性回归方程。一元线性回归方程是指描述两个变量之间直线关系的方程式,在回归分析中是应用最广泛的数学模型。根据试验或观测数据绘制散点图,其主要作用就在于形象地描绘两个变量关系的基本形态,以便初步确定关系方程表达式的类型,建立经验回归方程,从而对变量之间的变动关系作进一步的计算和分析。 2、一元线性回归模型的确定 7.46 7.46 7.46 一元线形方程另一种形式为点斜式: 二 在用回归方程进行预测和控制前需要判断X、Y之间是否确实存在线形相关关系。这就是一元线性回归方程的显著性检验。 ei为观测值Yi与回归方程估计值之间的偏差: Yi = a+bX+ei 假定 ei~ N(0, ) 将Y的总偏差ST分解为: S
文档评论(0)