第9章spss的西相关分析和线性回归分析.pptVIP

  • 7
  • 0
  • 约3.53千字
  • 约 52页
  • 2019-01-08 发布于福建
  • 举报

第9章spss的西相关分析和线性回归分析.ppt

第9章spss的西相关分析和线性回归分析

第9章 spss的相关分析和线性回归分析;相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。 本章主要内容: 对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。 建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Linear)和曲线估计(Curve Estimation)。 数据条件:参与分析的变量数据是数值型变量或有序变量。;本章内容;相关分析用于测量了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。 相关类型: 1、直线相关:两变量呈线性共同增大,???一增一减。 2、曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。 相关的方向   依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。;相关分析基本步骤:;如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能发现两个变量有没有关系呢? 最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。;不相关 ;但如何在数量上描述相关呢?下面引进几种对相关程度的度量。 Pearson相关系数 Spearman 秩相关系数 Kendall t 相关系数 ; Pearson相关系数(Pearson’s correlation coefficient)又叫相关系数或线性相关系数。它一般用字母r表示。;Pearson相关系数的局限性:;Spearman 秩相关系数;Spearman 秩相关系数适用范围:;侧重于两个分类变量均为有序分类的情况。这里的度量原理是把所有的样本点配对(如果每一个点由x和y的秩组成的坐标(x,y)代表,一对点就是诸如(x1,y1)和(x2,y2)的点对),然后看每一对中的x和y的的秩的观测值是否同时增加(或减少)。比如由点对(x1,y1)和(x2,y2),可以算出乘积(x2-x1)(y2-y1)是否大于0;如果大于0,则说明x和y同时增长或同时下降,称这两点协同(concordant);否则就是不协同。如果样本中协同的点数目多,两个变量就更加正相关一些否则就更负相关些;如果样本中不协同(discordant)与协同的点数差不过一样多,两个变量相关性就弱。;Kendall’s τ统计量的数学定义为:;人们可能会问,上面的三种对相关的度量都是在其值接近1或-1时相关,而接近于0时不相关。到底如何才能够称为“接近”呢? 这很难一概而论。但在计算机输出中都有和这些相关度量相应的检验和p-值;因此可以根据这些结果来判断是否相关; 画散点图 Graphs→Scatter 选择散点图的类型 根据所选择的散点图类型,单击Define对散点图作具体定义。 计算相关系数 Analyze→Correlate→Bivariate 选择参加计算的变量到Variable中 在Correlation Coefficents框中选择计算哪种相关系数 在Test of Significance框中选择输出单尾还是双尾p值 选择Flag significance correlations输出星号标记 在Options中选择其他描述统计量 ;简单相关分析;分析结果;本章内容;偏相关分析;偏相关系数的计算;偏相关系数的检验;偏相关分析的操作;本章内容;线性回归分析;线性回归模型假设条件与模型的各种检验; 对初三和高一的各科平均成绩这两个变量的数据进行线性回归,就是要找到一条直线来适当地代表图中的那些点的趋势。;首先需要确定选择这条直线的标准。这里介绍最小二乘回归(least squares regression)。古汉语“二乘”是平方的意思。 这就是寻找一条直线,使得所有点到该直线的竖直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合(fit)一条直线。 根据计算,找到初三成绩和高一成绩的回归直线。计算机输出给出来截距(Constant)26.444和斜率(变量j3的系数) 0.651。;截距=26.444; 斜率=0.651;这个直线实际上是对所假设的下面线性回归模型的估计(这里的e 是随机误差):;由于不同的样本产生不同的估计,所以估计量是个随机变量,它们也有分布,也可以用由他们构造检验统计量来检验b0和b1是不是显著。拿回归主要关心的来说,假设检验问题是;除了对b1的

文档评论(0)

1亿VIP精品文档

相关文档