- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第9章 spss的相关分析和线性回归分析;相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。
本章主要内容:
对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。
建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Linear)和曲线估计(Curve Estimation)。
数据条件:参与分析的变量数据是数值型变量或有序变量。;本章内容;相关分析用于测量了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。
相关类型:
1、直线相关:两变量呈线性共同增大,或一增一减。
2、曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。
相关的方向 依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。;相关分析基本步骤:;如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能发现两个变量有没有关系呢?
最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。;不相关 ;但如何在数量上描述相关呢?下面引进几种对相关程度的度量。
Pearson相关系数
Spearman 秩相关系数
Kendall t 相关系数
;
Pearson相关系数(Pearson’s correlation coefficient)又叫相关系数或线性相关系数。它一般用字母r表示。;Pearson相关系数的局限性:;Spearman 秩相关系数;Spearman 秩相关系数适用范围:;侧重于两个分类变量均为有序分类的情况。这里的度量原理是把所有的样本点配对(如果每一个点由x和y的秩组成的坐标(x,y)代表,一对点就是诸如(x1,y1)和(x2,y2)的点对),然后看每一对中的x和y的的秩的观测值是否同时增加(或减少)。比如由点对(x1,y1)和(x2,y2),可以算出乘积(x2-x1)(y2-y1)是否大于0;如果大于0,则说明x和y同时增长或同时下降,称这两点协同(concordant);否则就是不协同。如果样本中协同的点数目多,两个变量就更加正相关一些否则就更负相关些;如果样本中不协同(discordant)与协同的点数差不过一样多,两个变量相关性就弱。;Kendall’s τ统计量的数学定义为:;人们可能会问,上面的三种对相关的度量都是在其值接近1或-1时相关,而接近于0时不相关。到底如何才能够称为“接近”呢?
这很难一概而论。但在计算机输出中都有和这些相关度量相应的检验和p-值;因此可以根据这些结果来判断是否相关;
画散点图
Graphs→Scatter
选择散点图的类型
根据所选择的散点图类型,单击Define对散点图作具体定义。
计算相关系数
Analyze→Correlate→Bivariate
选择参加计算的变量到Variable中
在Correlation Coefficents框中选择计算哪种相关系数
在Test of Significance框中选择输出单尾还是双尾p值
选择Flag significance correlations输出星号标记
在Options中选择其他描述统计量
;简单相关分析;分析结果;本章内容;偏相关分析;偏相关系数的计算;偏相关系数的检验;偏相关分析的操作;本章内容;线性回归分析;线性回归模型假设条件与模型的各种检验; 对初三和高一的各科平均成绩这两个变量的数据进行线性回归,就是要找到一条直线来适当地代表图中的那些点的趋势。;首先需要确定选择这条直线的标准。这里介绍最小二乘回归(least squares regression)。古汉语“二乘”是平方的意思。
这就是寻找一条直线,使得所有点到该直线的竖直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合(fit)一条直线。
根据计算,找到初三成绩和高一成绩的回归直线。计算机输出给出来截距(Constant)26.444和斜率(变量j3的系数) 0.651。;截距=26.444; 斜率=0.651;这个直线实际上是对所假设的下面线性回归模型的估计(这里的e 是随机误差):;由于不同的样本产生不同的估计,所以估计量是个随机变量,它们也有分布,也可以用由他们构造检验统计量来检验b0和b1是不是显著。拿回归主要关心的来说,假设检验问题是;除了对b1的检验
文档评论(0)