网站大量收购独家精品文档,联系QQ:2885784924

第8章 回归分析-SPSS操作方法PPT.pptx

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 回归分析-SPSS操作方法PPT

SPSS 统计软件——回归分析 在教育研究中,常常会遇到彼此有关系的两列或多列变量。根据不同的目的,可以从不同的角度去分析变量之间的关系。 上一章介绍的相关分析,旨在分析变量之间关系的强度,可以找到一个度量这种关系强度的指标——相关系数。假设两个变量X和Y的相关显著,说明这两个变量有某种程度的共变关系,现希望通过X的值去预测Y的值,或者希望了解Y的变化在多大程度上可以由X的变化来解释。这时,称Y为因变量(dependent variable),X为自变量(independent variable)或预测变量。如果我们的目的是确定变量之间数量关系的可能形式,并用一个数学模型来表示这种关系形式,叫做回归分析(regression analysis)。高尔顿(F. Galton.1822-1911)回归分析的基本思想和方法以及回归这一名称的由来都要归功于英国统计学家高尔顿。高尔顿和他的学生皮尔逊在研究父母身高与其子女身高的遗传问题时,考察了1078对夫妇。以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高为因变量,结果发现两者近乎一条直线,其回归直线方程为:这一回归方程表明父母身高每增加一个单位时,其成年儿子的身高也平均增加0.516个单位。这个结果表明,虽然高个子父辈有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。反之,矮个子父辈的确有生矮个子儿子的趋势,但父辈身高减少一个单位,儿子身高仅减少半个单位左右。平均来说,一群高个子父辈的儿子们在同龄人中平均仅为略高个子;一群矮个子父辈的儿子们在同龄人中平均仅为略矮个子,即父辈偏离中心的部分在子代被拉回来一些。正是因为子代的身高有回到同龄人平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高,其子女更高,父辈个子矮,其子女更矮的两极分化现象。高尔顿引进了回归这个词来描述父辈身高与子代身高的关系。8.1 回归分析的基本原理8.1.1 回归线前一章介绍了相关散点图,可以发现各点不都在一条直线上。但如果散点的分布有明确的直线趋势,我们就可以配置一条最能代表散点图上分布趋势的直线,这条最优拟合线就称为回归线。常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和最小。8.18.1.2 回归方程回归分析的数学模型是:基本假设:因变量 y 受到我们已知的的 k 个自变量 x1,x2,x3,…,xk 的影响,同时还受到一些未知因素或随机因素的影响。每一组实际观察值yi,x1i,x2i,x3i,…,xki ε服从均数为零的正态分布因变量 y 也服从正态分布,其平均数记为: 上式称为回归方程,确定回归线的方程即为回归方程。回归分析的主要任务就是要求出这个回归方程右边的函数表达式,也就是求回归方程。在回归分析中,根据所求回归方程函数类型的不同,可分为线性回归分析和非线性回归分析两个大类;又可根据内含自变量个数为一个还是多个而分为一元回归分析和多元回归分析两大类。8.1.3 一元线性回归方程一元线性回归方程的通式为:式中a回归线在Y轴上的截距;b是回归线的斜率,称回归系数。一旦b和a这两个关键的统计量的值,根据实测数值计算出来之后,这个方程就确定了。 回归方程的求法:最小二乘法,就是应该使误差的平方和最小。 当我们做出散点图后,发现无论哪条直线也不可能使所有的散点都在其上。那么哪条直线最有代表性呢,根据最小二乘法,如果每一点沿Y轴方向到直线的距离的平方和最小,则这条直线在所有的直线中代表性是最好的,它的表达式就是所要求的回归方程。根据上面所说的最小二乘法,其公式为:把代入上式,得:求回归方程就是求当上式达到最小时a与b的值,而要使上式最小,需分别对a与b求偏导数,并令其等于零。由于这部分涉及到高数里的内容,我们不过多介绍,只需明白原理就行了。最后求得b和a的公式分别是:求出a和b之后,可以列出回归方程式:8.1.4 一元线性回归方程的检验根据样本数据计算出的回归方程可能有一定的抽样误差。为了考查这两个变量在总体上是否存在线性关系,以及回归方程对估计预测因变量的有效性如何,在回归方程应用之前,首先应进行显著性检验。一元线性回归方程的显著性,有以下三种等效的检验方法:(1)对回归方程进行方差分析。(2)对两个变量的相关系数进行与总体零相关的显著性检验。若相关系数显著,则回归方程也显著,即表明两个变量存在线性关系,否则则反之。(3)对回归系数进行显著性检验。以回归系数的显著性为例来说明回归方程检验的意义。回归系数是根据样本数据计算出来的,即使从总体回归系数β=0的总体中随机抽出的样本,由于抽样误差的影响,计算出的回归系数b也可能不等于零。因此不能根据样本回归系数b的大小判断X与Y之间是否存在线性关系,而应当看样本的b在以β=0为中心的抽样分布上

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档