第11章 回归及相关分析.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 回归及相关分析

§3 直线相关 一、相关程度的表示 1.相关系数(coefficient of correlation)r: 表示两个变数相关的密切程度的统计量 2.相关的种类 r=±1 表示完全相关 r=0 表示不相关 r=+1 叫完全正相关 r=-1 叫完全负相关0﹤|r|﹤1 表示不完全相关 0﹤|r|﹤0.7 表示弱相关 0.7≤|r|1 表示强相关 二.相关系数计算 例9.1 相关系数计算 (P160) SSy=249.6 SSx=144.6 SPxy=-159.0 三、决定系数r2 ( coefficient of determination) 回归平方和: 总平方和 : 因为: 所以: 0≤ r2 ≤1 决定系数为正值 决定系数只表示相关程度 不表示相关性质 因为: 所以,决定系数实质是相关系数的平方。 四、相关系数的检验 1.t测验 ①、建立无效假设 H0 x与y不相关。 ②、计算统计量, 相关系数标准误Sr和t值 ③、 依n-2查t表得tα ④、用tα与计算的t值比较,若 ,则推翻假设。 上例 t0.01(7)=3.5 ,故相关极显著 2.查表法: 用df=n-2查相关系数检验表,得 上例 查表10(P313)得: 则相关显著 依 说明x与y存在极显著的负相关 五、相关系数与回归系数的关系 从相关系数计算公式的导出可以看到: 相关变量x与y的相关系数r 是y对x的回归系数byx与x对y的回归系数bxy的几何平均数: 上式表明直线相关分析与回归分析关系十分密切。 事实上,回归分析与相关分析研究对象都是呈直线关系的相关变量。直线回归分析将二个相关变量区分为自变量和依变量,侧重于寻求它们之间的联系形式——直线回归方程;直线相关分析不区分自变量和依变量,侧重于揭示它们之间的联系程度和性质——计算出相关系数。 两种分析所进行的显著性检验都是解决y与x间是否存在直线关系。因而二者的检验是等价的。即相关系数显著,回归系数亦显著;相关系数不显著,回归系数也必然不显著。 由于利用查表法对相关系数进行检验十分简便,因此在实际进行直线回归分析时,可用相关系数显著性检验代替直线回归关系显著性检验,即可先计算出相关系数r并对其进行显著性检验,若检验结果r不显著,则用不着建立直线回归方程;若r显著,再计算回归系数b、回归截距a,建立直线回归方程,此时所建立的直线回归方程代表的直线关系是真实的,可用来进行预测和控制。 六、应用直线回归与相关的注意事项 1、变量间是否存在相关 直线回归分析和相关分析是处理变量间关系的数学方法,在将这些方法应用于生物科学研究时要考虑: 1)变量间是否存在直线相关; 2)在什么条件下会发生直线相关; 3)求出的直线回归方程是否有意义; 4)某性状作为自变量或依变量的确定等。 这些都必须由生物科学相应的专业知识来决定,并且还要用到生物科学实践中去检验。如果不以一定的生物科学依据为前提,把风马牛不相及的资料随意凑到一块作直线回归分析或相关分析,那将是根本性的错误。 2、其余变量尽量保持一致 由于自然界各种事物间的相互联系和相互制约,一个变量的变化通常会受到许多其它变量的影响,因此,在研究两个变量间关系时,要求其余变量应尽量保持在同一水平,否则,回归分析和相关分析可能会导致完全虚假的结果。例如研究人的身高和胸围之间的关系,如果体重固定,身高越高的人,胸围越小,但当体重在变化时,其结果也就会变化。 3、观测值要尽可能的多 在进行直线回归与相关分析时,两个变量成对观测值应尽可能多一些,这样可提高分析的精确性,一般至少有5对以上的观测值。同时变量x的取值范围要尽可能大一些,这样才容易发现两个变量间的变化关系。 4、外推要谨慎 直线回归与相关分析一般是在一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间关系类型可能会发生改变,所以回归预测必须限制在自变量x的取值区间以内,外推要谨慎,否则会得出错误的结果。 5、正确理解回归或相关显著与否的含义 一个不显著的相关系数并不意味着变量x和y之间没有关系,而只有能说明两变量间没有显著的直线关系;一个显著的相关系数或回归系数亦并不意味着x和y的关系必定为直线,因为并不排除有能够更好地描述它们关系的非线性方程的存在。 6、一个显著的回归方程并不一定具有实践上的预测意义 如一个资料 x、y两个变量间的相关系r =0.5,在 df =24时,r0.01(24)=0.496,rr0.01(24)表明相关系数极显著。而r2=0

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档