- 1、本文档共379页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS回归分析应用
SPSS 16实用教程 第7章 回归分析 【Dependent框】 用于选入回归分析的应变量。 【Block按钮组】 由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。 【Independent框】 用于选入回归分析的自变量。 【Method下拉列表】 用于选择对自变量的选入方法,有Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。该选项对当前Independent框中的所有变量均有效。 【Selection Variable框】 选入一个筛选变量,并利用右侧的Rules钮建立一个选择条件,这样,只有满足该条件的记录才会进入回归分析。 【Case Labels框】 选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。 【WLS钮】 可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框,出现WLS Weight框,在该框内选入权重变量即可。 弹出Statistics对话框,用于选择所需要的描述统计量。有如下选项: Regression Coefficients复选框组:定义回归系数的输出情况,选中Estimates可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta;选中Confidence intervals则输出每个回归系数的95%可信区间;选中covariance matrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中Estimates。 Residuals复选框组:用于选择输出残差诊断的信息,可选的有Durbin-Watson残差序列相关性检验、超出规定的n倍标准误的残差列表。 Model fit复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:,R,R2和调整的R2, 标准误及方差分析表。 R squared change复选框:显示模型拟合过程中R2、F值和p值的改变情况。 Descriptives复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。 Part and partial correlations复选框:显示自变量间的相关、部分相关和偏相关系数。 Collinearity diagnostics复选框:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues)、方差膨胀因子(VIF)等。 【Plot钮】 弹出Plot对话框,用于选择需要绘制的回归分析诊断或预测图。可绘制的有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。 【Save钮】 许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一步的分析,Save钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。下方的按钮可以让我们选择将这些新变量存储到一个新的SPSS数据文件或XML中。 (四)数据的中心化和标准化 在多元线性回归分析中,因为涉及到多个自变量,自变量的单位往往不同,给利用回归方程的结构分析带来了一定困难,又因为各变量的水平不同,使计算时四舍五入的误差很大,所以对于多元线性回归分析,常常将数据中心化或标准化后,再建立模型。 2.多元回归的回归函数矩阵表达 多重回归模型的进一步诊断 强影响点 异常点 严重偏离既定模型的数据点(Y空间的点) 观察标准化残差是否介于正负2之间 高杠杆点 远离主体的数据点(X空间的点) 强影响点 对统计推断影响特别大的点 异常点和高杠杆点 多重共线性 强影响点的诊断与对策 诊断 散点图 Statistic对话框中的残差诊断指标 Save对话框中的距离指标和专门的影响力统计量 对策 去除强影响点 变量变换 非参数分析 最小一乘 加权最小二乘 多重共线性 多重共线性 定义 自变量间存在着线性关系,使一个或几个自变量可以由另外的自变量线性表示时,称为该变量与另外的自变量间存在有共线性(collinearity)。 识别方法 回归方程显著,但各偏回归系数不显著 回归系数的大小或符号与专业知识不符 变量的重要性与专业不符 去掉一两个变量或记录,回归系数发生剧烈抖动 注:若变量间存在非线性关系,则拟合方程不一定不可靠 多重共线性 确认 观察相关系数矩阵 容忍度(Tolerance):越小越严重 方差膨胀因子(VIF):越大(10)越严重 特征根(EigenValue):近似为0的个数越多越严重 条件指数(CI): (最大特征根/其它的特征根) CI大于15时可能存在多重共线性 CI大于3
文档评论(0)