网站大量收购闲置独家精品文档,联系QQ:2885784924

九直线回归与相关分析.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
九直线回归与相关分析

第九章 直线回归与相关分析 Linear Regression and Correlation Analysis 第一节 回归和相关的概念 客观事物是普遍联系的,事物间往往存在着一定的特定的关系:人的身高与体重,施肥与作物产量,降雨量与作物病虫害发生程度,温湿条件与微生物的繁殖等。 协变关系:事物之间的相互关系都涉及两个或两个以上的变量,只要其中的一个变量变动了,另一个变量也会跟着变动,这种相互关系称为协变关系。 协变量:具有协变关系的变量也称为~。 两个以上变量之间共同受到另外因素的影响。 对有协变关系的两个变量,一个变量用符号x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的成对观测值,可表示为(x1,y1),(x2,y2),…,(xn,yn)。 散点图:将每一对观测值在平面直角坐标系中表示成一个点,直观表示x和y变化关系。 从散点图可以看出: ①两个变量间关系的性质和程度; ②两个变量间关系的类型,是直线型还是曲线型; ③是否有异常观测值的干扰等。 散点图只能定性的表示两个变量之间的关系,不能反映它们之间定量的规律性。 回归与相关的统计分析方法: 如果两个变量间关系属于因果关系,一般用回归来研究。 自变量(independent variable):表示原因的变量称为自变量,用x表示。自变量是固定的(试验时预先确定的),没有随机误差。 依变量(dependent variable):表示结果的变量称为依变量,用y表示。 y是随x的变化而变化的,并有随机误差。 例如作物施肥量和产量之间的关系,前者是表示原因的变量,为事先确定的,是自变量,后者是表示结果的变量,且具有随机误差,为依变量,作物产量是随施肥量的变化而变化的。 通过回归分析,可以找出依变量变化的规律性,且能由x取值预测y的取值范围。 两变量是平行关系,只能用相关来进行研究。在相关分析中,变量x和y无自变量和依变量之分,且都具有随机误差。 相关分析只能研究两个变量之间相关程度和性质,不能用一个变量的变化去预测另一个变量的变化,这是回归与相关区别的关键所在。 但是二者不能截然分开,因为由回归可以获得相关的一些重要信息信,由相关也可以获得回归的一些重要信息。 在回归和相关分析中,必然注意下面一些问题,以避免统计方法的误用。 (1) 变量间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各具体学科本身来决定。 回归只能作为一种分析手段,帮助认识和解释事物的客观规律。决不能把风马牛不相及的资料凑到一起进行分析; (2)由于自然界各种事物间的相互联系和相互制约,一个变量的变化通常会受到许多其他变量的影响,因此,在研究两个变量之间的关系时,要求其余变量尽量保持在同一水平,否则,回归和相关分析就可能会导致不可靠甚至完全虚假的结果。 例如人的身高和胸围之间的关系,如果体重固定,身高越高的人,胸围一定较小,当体重变化时,其结果就会相反; (3)在进行回归与相关分析时,两个变量成对观测值应尽可能多一些,这样可提高分析的准确性,一般至少有5对以上的观测值。同时变量x的取值范围要尽可能大一些,这样才容易发现两个变量间的协变关系; (4)回归与相关分析一般是在变量的一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间的关系类型可能会发生改变,所以回归预测必须限制自变量x的取值区间,外推要谨慎,否则会得出错误的结果。 第二节 直线回归 一、直线回归方程的建立 如果两个变量在散点图上呈线性关系,就可用直线回归方程来描述,其一般形式为: b是回归直线的斜率,叫回归系数,其含义是自变量x增加一个单位,y平均增加或减少的单位数。 回归直线在平面坐标系中的位置取决于a,b的取值,为了使 =a + bx能最好地反映y和x两变量间的数量关系,根据最小二乘法,必须使: 式9.4中的分子 是x的离均差和y的离均差的乘积之和,简称乘积和,记作SP,分母是x的离均差平方和,记作SSx。 a和b均可取正值,也可以取负值,因具体资料而异。 将x的取值范围代入直线回归方程,可计算出 值,研究y和 之间的关系,可发现回归方程的三个基本性质: 例9.1 有人研究了黏虫孵化历期平均温度(x,°C)与历期天数(y,d)之间关系,试验资料列入表9—l。试配合直线回归方程。 二、直线回归的数学模型和基本假定 在直线回归中,y总体的每一个观测值可分解为三部分,即y的总体平均数μy、因x引起y的变异β(x - μx)以及y的随机误差ε。因此,直线回归的数学模型为: 式9.6、式9.7为总体资料的数学模型,α 为总体回归截距,β为总体回归系数,ε为随机误差。 如果是样本资料,直线回归的数学模型为: 直线

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档