网站大量收购闲置独家精品文档,联系QQ:2885784924

第十章相关与回归分析(1).ppt

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
可以看出,x与 y之间的关系近似为直线关系。我们可以对其配合一条回归直线。 为计算回归方程的系数a、b,我们先对原始数据进行加工。 y x2 y2 xy 100 105 130 145 170 175 190 190 220 235 0.81 1.00 1.44 1.96 2.25 2.56 2.89 3.24 3.61 4.00 10000 11025 16900 21025 28900 30625 36100 36100 48400 55225 90 105 156 203 255 280 323 342 418 470 1660 23.76 294300 2642 炉次 x 1 2 3 4 5 6 7 8 9 10 ? 0.9 1.0 1.2 1.4 1.5 1.6 1.7 1.8 1.9 2.0 15.0 原始数据加工表 于是: 所以: 故精炼时间关于含碳量的回归方程为: y= ?14.9525+120.635x ? 计算结果表明,这个方程显示着钢水溶液的含碳量每增加0.1%,则精炼时间平均来说大约要延长12.06分。 根据回归方程,可以给出自变量的任一数值估计或预测因变量的平均可能值。 y=?14.9525+120.635?2.2=150.4445(分) ? 例如,求含碳量2.2%所需的精炼时间: (四)相关系数 相关分析是用以说明变量之间相关程度的统计工具。相关分析常常与回归分析联合使用,以衡量回归方程所表示的因变量变化的精确度如何。相关分析也可单独用于衡量变量之间的联系程度。本节我们讨论两个变量之间线性相关程度问题。两个变量之间线性相关程度的描述通常采用相关系数。 (1)相关系数的意义 我们回过头来考察一下线性回归中指标 y的值yi与回归估计值 yi 的离差平方和。 ? 记 于是有:Q=Lyy(1?r2) r称为相关系数。它是在线性相关条件下用来说明两个变量之间相关关系密切程度的指标。 因为Q≥0,Lyy≥0,故相关系数有一个重要性质: |r| ≤1 r= ? 1 (1) ?1 r =0 (2) r=0 (3) r=0 (4) 0r1 (5) r=1 (6) 相关图与相关系数经验关系 由于Lyy对于一组实测数据来讲是定值,故由Q=Lyy(1?r2)可知,当|r|较大接近于1时,离差平方和Q就较小而接近于0,此时,y与x高度相关。特别当|r|=1时,称它们是完全相关的,上图(1)、(6)所示。当|r|较小而接近于0时,Q就大,y与x的相关关系很弱,特别当 r=0时,称它们线性无关。如上图 (3)、(4)所示 由于Lxy可正可负,所以相关系数r也可正可负。若r>0则称y与x正相关,如上图(5)、(6)所示。此时,随着x的增大(或减小),y将呈现增大(或减小)的趋势。特别对于上图(6)的情形,由于r=1,故称完全正相关。若r0,则称y与x负相关,如上图(1)、(2)所示。此时,随着x的增大(或减小),y将呈现减小(或增大)的趋势。特别对于图(1)的情形。由于r= ?1,故称为完全负相关。一般认为相关系数的绝对值在0.7以上为高度相关,0.3-0.7之间为中度相关,0-0.3为低相关。 应当注意,相关系数r只表明x与y之间的线性关系的密切程度和方向。当r很小甚至为0时,只表明x与y之间的线性关系不密切,或不存在线性关系,并不表示x与y之间就没有关系,可能二者之间有非线性关系。如上图 (4)所示,x与y之间就存在着曲线关系。 (2)相关系数的计算 我们已经知道,相关系数的公式为: 第二节中我们介绍了离差乘积的和式: 于是有: 如果将分子分母同乘以n,又可得: 根据前例中炼钢厂钢液含碳量与精炼时间资料,可计算相关系数。那里,我们已经求得: 于是其相关系数为: 计算得出r=0.9892,表明精炼时间和含碳量之间为正相关关系。而且r值接近于1,表示两者关系很密切。 三、定类变量间的相关关系判定及检验 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。要判别这些分类间是否有相关关系就得用到相应的方法。 (一)交互分类表 交互分类表又叫列联表和条件次数表。它是按两个变量的值将所研究的个案进行分类,亦即将两个变量的次数交互分配在一张统计表中成为一个矩阵,这种表就叫交互分类表。例如:某单位对职工的闲暇时间进行了调查,根据不同年龄档和喜爱的电视节目进行了如下的统计分类: 收视倾向 年龄层 老年 中年 青年 戏曲 20 10 2 电视剧

文档评论(0)

xiaohuer + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档