统计学——原理与SPSS应用 作者 李卉妍 第10章 相关分析与回归分析.pptVIP

统计学——原理与SPSS应用 作者 李卉妍 第10章 相关分析与回归分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 10章 相关分析与回归分析 第10章 相关分析与回归分析 §10.1 相关分析的意义与内容 §10.2 相关关系和相关程度的判断 §10.3 回归模型的建立 相关分析的主要内容包括: (1)判定现象之间是否存在相关关系及其相关的表现形式。 (2)测定现象之间相关关系的密切程度。 (3)确定相关关系的数学表达式。 (4)确定因变量估计值的误差程度。 §10.2 相关关系和相关程度的判断 相关关系的概念和种类 相关程度的判断方法 函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 相关关系 (correlation) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 简单相关 (类型) 相关关系描述与测度 (散点图) 散点图 (scatter diagram) 相关关系的描述与测度 (相关系数) 相关系数 (correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,记为 r 相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数 (取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负相关 r = 0,不存在线性相关关系相关 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 回归分析的意义 回归分析,就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一种重要的方法。 趋向中间高度的回归 回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。 回归分析与相关分析的区别 (1)相关分析可以不必确定哪一个是自变量,哪一个是因变量,其涉及的变量之间的关系是对等的;回归分析所研究的两个变量之间的关系不是对等的。 (2)相关分析主要是通过相关系数这一指标来反映变量之间相关的密切程度的高低;而回归分析则是利用所建立的回归方程,根据自变量的给定值,估计、推算、预测因变量的可能值。 (3)计算相关系数时,改变两个变量的地位并不影响相关系数的数值,所以只有一个相关系数;回归分析一般可以根据研究目的不同,分别建立两个不同的回归方程,即一个是以x为自变量,y为因变量的“y对x的回归方程”;另一个是以y为自变量,x为因变量的“x对y的回归方程”。 (4)相关分析中两个变量可以都是随机的;而在回归分析时,把自变量当做研究时可以控制的量,是非随机的,因变量才是随机的。 回归模型的类型 一元线性回归模型 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一条线性方程来表示 多元线性回归模型 一元线性回归将影响因变量的自变量限制为一个,这在现实的大量社会经济现象中并不易做到。因而,实际应用回归分析法时,常需要有更一般的模型,把两个或更多个解释变量的影响分别估计在内。这就是多元回归亦称多重回归。当影响因素与因变量之间是线性关系时,所进行的回归分析就是多元线性回归。 点预测 ?利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个估计值 ,就是点预测。 区间预测 点预测不能给出估计的精度,点预测值与实际值之间是有误差的,因此需要进行区间预测 对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个预测区间 预测区间 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个

您可能关注的文档

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档