第6讲 SPSS的相关分析和线性回归分析.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6讲 SPSS的相关分析和线性回归分析

* 第6讲 SPSS的相关分析和线性回归分析 §6.1 相关分析 目的:分析两变量间统计关系的强弱程度。当 分析两变量间线性统计关系的强弱程度 时,采用相关系数。对不同类型的变量 应采用不同的相关系数来度量,常用的 相关系数主要有Pearson简单相关系数、 Spearman等级相关系数、Kendall 相关系数。 操作:Analyze→Correlate →Bivariate。 1 Pearson简单相关系数 适用:度量定距变量间的线性相关关系。 数学定义: 检验统计量:服从n-2个自由度的t分布。 例6.1 t6-1中,收集1999年31个省市自治区部分高校有关社科方面的研究数据,利用此表检验研究立项课题数(当年)与投入的具有高等职称的人数(上年)、发表的论文数(上年)之间是否有较强的线性关系。 结果见图6-1及表6-1。由图6-1及表6-1可知,课题数与高等职称的人数、论文数之间都有较强的线性关系;表6-1中,“﹡”表示显著性水平为0.05,“﹡ ﹡”表示显著性水平为0.01。 图6-1 课题相关因素的矩阵散点图 表6-1 课题相关因素的简单相关系数矩阵 2 Spearman等级相关系数 适用:度量定序变量间的线性相关关系。 数学定义及检验统计量: 检验统计量:“两总体的偏相关系数与零无显著差 异”的零假设下,t统计量服从自由 度为n-q-2的t分布。 其中,r为偏相关系数;q为偏相关阶数。 操作:Analyze→Correlate →Partial。 例6.2 在例6.1中发现,课题数与论文数之间都有较强的正线性相关关系。但这种关系中可能掺入了高级职称人数的影响(见表6-1),因此需要进行课题数与论文数之间的偏相关分析。 结果见表6-2。可以看出,课题数与论文数之间的偏相关系数比简单相关系数减少了,并且偏相关系数变得统计上不显著。 §6.3 线性回归分析 1 回归分析的概念 是通过回归方程描述变量间的因果关系的 一种数量分析方法,研究一个或多个解释变量对一个被解释变量的影响程度。 2 多元线性回归模型 3 回归参数的普通最小二乘(OLS)估计 OLS法是最常见的参数估计方法,其原理是使每个样本点与回归线上的对应点在垂直方向上的离差平方和最小得条件下,得到参数的估计值。即对下面的回归模型求极值及解方程组,得到回归参数的估计值。 4 回归方程的统计检验 通过样本数据建立回归方程后一般不能用于 对实际问题的分析和预测,通常要进行各种 统计检验,包括回归方程的拟合优度检 验、回归方程的显著性检验、回归系数的显 著性检验、残差分析等。 (1)回归方程的拟合优度检验 目的:检验样本数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。 统计量: (2)回归方程的显著性检验 目的:检验被解释变量与解释变量间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。 统计量: (3)回归系数的显著性检验 目的:检验每个解释变量与被解释变量间是否存在线性关系,进而判断该解释变量是否应留在线性模型中。 统计量: (4)残差分析 概念:如果回归方程能够较好地解释被解释变量的变化,那么残差序列中不应包含明显的规律性和趋势性,残差分析就是检验残差序列中是否包含明显的规律性和趋势性。因此残差分析包含以下内容。 ①残差均值为0的正态性分析 画散点图。 ②残差序列的独立性分析 分析方法有绘制图形、计算自相关系数、DW(Durbin-Watson)检验三种。 ③异方差分析 目的:当随机误差项存在条件异方差时,OLS估计不再是最小方差的无偏估计,不再是有效估计;容易导致回归系数限制性检验的t值偏高,进而容易拒绝其零假设,设那些本不应留在方程中的变量被保留下来,并最终使模型的预测偏差较大。 检验:方法之一是Spearman等级相关系数法,其中变量为残差绝对值序列的秩和解释变量的秩。 矫正:存在条件异方差时应用加权OLS估计参数。 ④异常值检验 ⑤变量的筛选 向前筛选(Forward):首先选择与被解释变量具有最高线性相关系数的变量进入方程,并进行回归方程的各种检验;然后在剩余的变量中寻找被解释变量偏相关系数最高且通过检验的变量进入方程;直到没有可进入方程的变量为止。 向后筛选(Backward):首先所有变量全部引入方程;然后在回归系数显著性检验不显著的一

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档