利用SPSS 进行Logistic 回归的分析.doc

下载文档 降价啦

20
0
约7.36千字
约 15页
2017-09-02 发布于安徽
举报
版权申诉
保障服务

利用SPSS 进行Logistic 回归的分析.doc

1、本文档共15页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载！

第 8 章利用 SPSS 进行Logistic 回归分析现实中的很多现象可以划分为两种可能，或者归结为两种状态，这两种状态分别用0 和1 表示。如果我们采用多个因素对0－1 表示的某种现象进行因果关系解释，就可能应用到logistic 回归。Logistic 回归分为二值logistic 回归和多值logistic 回归两类。首先用实例讲述二值logistic 回归，然后进一步说明多值logistic 回归。在阅读这部分内容之前，最好先看看有关SPSS 软件操作技术的教科书。 §8.1 二值logistic 回归 8.1.1 数据准备和选项设置我们研究 2005 年影响中国各地区城市化水平的经济地理因素。城市化水平用城镇人口比重表征，影响因素包括人均GDP、第二产业产值比重、第三产业产值比重以及地理位置。地理位置为名义变量，中国各地区被分别划分到三大地带：东部地带、中部地带和西部地带。我们用各地区的地带分类代表地理位置。第一步：整理原始数据。这些数据不妨录入Excel 中。数据整理内容包括两个方面：一是对各地区按照三大地带的分类结果赋值，用0、1 表示，二是将城镇人口比重转换逻辑值，变量名称为“城市化”。以各地区2005 年城镇人口比重的平均值45.41%为临界值，凡是城镇人口比重大于等于45.41%的地区，逻辑值用Yes 表示，否则用No 表示（图8-1-1）图 8-1-1 原始数据（Excel 中，局部）将数据拷贝或者导入 SPSS 的数据窗口（Data View）中（图8-1-2）。图 8-1-2 中国31 个地区的数据（SPSS 中，局部）第二步：打开“聚类分析”对话框。沿着主菜单的“Analyze→Regression→Binary LogisticK”的路径（图8-1-3）打开二值 Logistic 回归分析选项框（图8-1-4）。图 8-1-3 打开二值Logistic 回归分析对话框的路径对数据进行多次拟合试验，结果表明，像二产比重、三产比重等对城市化水平影响不显著。至于反映地区位置的分类变量，不宜一次性的全部引入，至多引入两个，比方说东部和中部。通过尝试，发现引入中部地带为变量比较合适。因此，为了实例的典型性，我们采用两个变量作为自变量：一是数值变量人均GDP，二是分类变量中部地带。图 8-1-4 Logistic 回归分析选项框第三步：选项设置。首先，在源变量框中选中需要进行分析的变量，点击右边的箭头符号，将需要的变量调入Dependent（因变量）和Covariates（协变量）列表框中（图8-1-5）。在本例中，将名义变量“城市化”调入Dependent（因变量）列表框，将“人均GDP”和“中部”调入Covariates （协变量）列表框中。在 Method（方法）一栏有七个选项。采用第一种方法，即系统默认的强迫回归方法（Enter）。图 8-1-5 Logistic 回归分析的初步设置接下来进行如下 4 项设置： ⒈ 设置 Categorical（分类）选项：定义分类变量（图8-1-6）。将中部调入 Categorical Covariates（分类协变量）列表框，其余选项取默认值即可。完成后，点击Continue 继续。图 8-1-6 定义分类变量选项 ⒉ 设置 Save（保存）选项：决定保存到Data View 的计算结果（图8-1-7）。选中 Leverage values、DfBeta(s)、Standardized 和Deviance 四项。完成后，点击Continue 继续。图 8-1-7 Logistic 回归分析的存储选项 ⒊ 设置 Options：有三个选项区（图8-1-5）。第一个是 Statistics and Plots（统计和画图）选项，包括六种可以兼容的选择（复选项）。选中Classification plots、Hosmer-Lemeshow goodness-of-fit 和CI for exp(B)三个选项。第二个是 Display（显示）选项，选择At last step（最后一步），这样，输出结果将仅仅给出最终结果，而省略每一步的计算过程。由于我们采用强迫回归，Probability for Stepwise（逐步回归概率）选项可以不管。图 8-1-8 Logistic 回归分析的选项设置此外还有一个选项需要说明。一是 Classification cutoff（分类临界值），默认值为0.5，即按四舍五入的原则将概率预测值化为0 或者1。如果将数值改为0.6，则大于等于0.6 的概率值才表示为1，否则为0。其情况余依此类推。二是Maximum Iterations（最大迭代