- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[农学]生物统计学8
回归分析 (regression analysis) 揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制依变量(结果)。 相关分析 (correlation analysis) 研究两个变量之间相关的程度和性质或一个变量与多个变量之间相关程度。 回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量y与变量x处在平等的地位; 相关分析中所涉及的变量y与x全是随机变量,而回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机变量; 相关分析主要是为刻画两类变量间线性相关的密切程度,而回归分析不仅可以揭示变量x对y的影响大小,还可以由回归方程进行预测和控制。 如果两个相关变量间的关系是直线关系,根据n对观测值所描出的散点图 : 决定系数: 相关系数有正负之分,可以确切地说明相关的性质(即正负),但它对相关程度的说明则有所夸大。为此,近年来,度量相关关系有更多地同时使用决定系数(determination coefficient,r2)的趋势 。 1.决定系数的计算并不比相关系数的计算麻烦,决定系数(r2)是相关系数(r)的平方 2.决定系数的意义比相关系数清楚 它表示在x或y的总变异中可以相互以线性关系说明的部分所占的比率,它比相关系数更能真实地反映x和y的相关程度。 3. 决定系数(r2)可避免对相关程度作夸大的解释 因为除掉|r| = 0和1的情况外,r2总是小于r。例如r=0.5,并不表明x和y的变异可以线性关系说明的部分占50%,而占的是r2=(0.5)2=25% 。 但决定系数也有缺点,因为决定系数(r2)只有正值,其取值区间为[0,1],所以,它不能表示相关的性质(即正负)。因此,在相关分析中将两者结合起来是可取的。 本章内容要点 直线回归方程的建立 散点图,计算a, b 理解直线回归方程的假设检验 相关分析:计算决定系数,相关系数 理解直线回归与相关分析的区别及应用注意事项 SPSS 应用 两变量间依存变化的数量关系 两变量间相关关系 回归 相关 相关与回归的区别 应用 x y 单向 x y x y 双向 回归系数与相关系数的正负号都由两变量离均差积之和的符号决定,所以同一资料的b与其r的符号相同。 回归系数有单位,形式为(因变量单位/自变量单位),相关系数没有单位。 相关系数的范围在-1~+1之间,而回归系数没有这种限制。 有些资料用相关表示较适宜,比如兄弟与姐妹间的身长关系、人的身长与前臂长之间的关系等资料。 有些资料用相关和回归都适宜,此时须视研究需要而定。 就一般计算程序来说,是先求出相关系数r并对其进行假设检验,如果r显著并有进行回归分析之必要,再建立回归方程。 I II III IV I II III IV I II III IV 直线相关的两个变量的相关程度和性质 乘积和 (1)单位问题 (2)x与y本身的变异程度 ? n (3)样本个数 r相关系数 两个变量的变异程度 两个变量的度量单位 两个变量的个数 r可以用来比较不同双变量的相关程度和性质。 两个变量在相关系数计算中的地位是平等的,没有自变量和依变量之分 相关 回归 区 别 用 y 可以准确预测y值 x与y完全相关。 完全正相关 完全负相关 散点图上所有点必在一条直线上。 回归一点作用也没有,即用x的线性函数完全不能预测y值的变化。 x与y之间不存在直线相关关系,这时散点图分布紊乱,没有直线的趋势,但可能存在非线性关系。 I II III IV r2:决定系数 coefficient of determination 温度 天数 黏虫孵化历期平均温度与历期天数成负相关。 x和y的变异有93.74%可用二者之间的线性关系来解释。 ρ=0 x y (x1,y1) (x2,y2) (x3,y3) (xn,yn) P ? (1)假设 (2)水平 (3)检验 (4)推断 H0:ρ=0 ;HA:ρ≠0 选取显著水平α 在α显著水平上,否定H0,接受HA;推断r显著。 在α显著水平上,接受H0,否定HA;推断r不显著。 椰子树的产量数 X(个) 椰子树的高度 Y(尺) X(个) 120 121 123 126 128 Y(尺) 21 23 22 25 24 椰子树的产果树与树高之间无直线相关关系。 当样本太小时,即使r值达到0.7996,样本也可能来自总体相关系数ρ=0的总体。 不能直观地由r值判断两变数间的相关密切程度。 试验或抽样时,
文档评论(0)