- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
第 8 章 利用 SPSS 进行Logistic 回归分析
现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0
和1 表示。如果我们采用多个因素对0-1 表示的某种现象进行因果关系解释,就可能应用
到logistic 回归。Logistic 回归分为二值logistic 回归和多值logistic 回归两类。首先用实例讲
述二值logistic 回归,然后进一步说明多值logistic 回归。在阅读这部分内容之前,最好先看
看有关SPSS 软件操作技术的教科书。
§8.1 二值logistic 回归
8.1.1 数据准备和选项设置
我们研究 2005 年影响中国各地区城市化水平的经济地理因素。城市化水平用城镇人口
比重表征,影响因素包括人均GDP、第二产业产值比重、第三产业产值比重以及地理位置。
地理位置为名义变量,中国各地区被分别划分到三大地带:东部地带、中部地带和西部地带。
我们用各地区的地带分类代表地理位置。
第一步:整理原始数据。这些数据不妨录入Excel 中。数据整理内容包括两个方面:一
是对各地区按照三大地带的分类结果赋值,用0、1 表示,二是将城镇人口比重转换逻辑值,
变量名称为“城市化”。以各地区2005 年城镇人口比重的平均值45.41%为临界值,凡是城
镇人口比重大于等于45.41%的地区,逻辑值用Yes 表示,否则用No 表示(图8-1-1)
图 8-1-1 原始数据(Excel 中,局部)
将数据拷贝或者导入 SPSS 的数据窗口(Data View)中(图8-1-2)。
图 8-1-2 中国31 个地区的数据(SPSS 中,局部)
第二步:打开“聚类分析”对话框。
沿着主菜单的“Analyze→Regression→Binary LogisticK”的路径(图8-1-3)打开二值
Logistic 回归分析选项框(图8-1-4)。
图 8-1-3 打开二值Logistic 回归分析对话框的路径
对数据进行多次拟合试验,结果表明,像二产比重、三产比重等对城市化水平影响不显著。至于反映地区位置的分类变量,不宜一次性的全部引入,至多引入两个,比方说东部和
中部。通过尝试,发现引入中部地带为变量比较合适。因此,为了实例的典型性,我们采用
两个变量作为自变量:一是数值变量人均GDP,二是分类变量中部地带。
图 8-1-4 Logistic 回归分析选项框
第三步:选项设置。
首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调
入Dependent(因变量)和Covariates(协变量)列表框中(图8-1-5)。在本例中,将名义变
量“城市化”调入Dependent(因变量)列表框,将“人均GDP”和“中部”调入Covariates
(协变量)列表框中。
在 Method(方法)一栏有七个选项。采用第一种方法,即系统默认的强迫回归方法
(Enter)。
图 8-1-5 Logistic 回归分析的初步设置
接下来进行如下 4 项设置:
⒈ 设置 Categorical(分类)选项:定义分类变量(图8-1-6)。
将中部调入 Categorical Covariates(分类协变量)列表框,其余选项取默认值即可。完
成后,点击Continue 继续。
图 8-1-6 定义分类变量选项
⒉ 设置 Save(保存)选项:决定保存到Data View 的计算结果(图8-1-7)。
选中 Leverage values、DfBeta(s)、Standardized 和Deviance 四项。完成后,点击Continue
继续。
图 8-1-7 Logistic 回归分析的存储选项
⒊ 设置 Options:有三个选项区(图8-1-5)。
第一个是 Statistics and Plots(统计和画图)选项,包括六种可以兼容的选择(复选项)。
选中Classification plots、Hosmer-Lemeshow goodness-of-fit 和CI for exp(B)三个选项。
第二个是 Display(显示)选项,选择At last step(最后一步),这样,输出结果将仅仅
给出最终结果,而省略每一步的计算过程。
由于我们采用强迫回归,Probability for Stepwise(逐步回归概率)选项可以不管。
图 8-1-8 Logistic 回归分析的选项设置
此外还有一个选项需要说明。一是 Classification cutoff(分类临界值),默认值为0.5,
即按四舍五入的原则将概率预测值化为0 或者1。如果将数值改为0.6,则大于等于0.6 的概
率值才表示为1,否则为0。其情况余依此类推。二是Maximum Iterations(最大迭代
您可能关注的文档
- 宏观审慎监管模式对中国金融监管改革的影响的研究.doc
- 宏观审慎监管视角的金融监管目标实现程度的实证的分析下.doc
- 宏观调控政策对房地产价格指数波动影响的实证的分析.doc
- 宏观形势与市场的分析报告 金融模拟第2篇报告(共5篇).doc
- 后危机时期中国宏观金融政策的退出及其影响的分析.doc
- 湖南津滨发展公司玛歌庄园项目的市场营销策略研究.doc
- 护理程序在社区护理中应用.doc
- 护理的研究自学考试试题及答案.doc
- 护理学的研究试题及答案.doc
- 护理专业女生恋爱心理问题调查的研究.doc
- 2023年河北省保定市高碑店市卫生健康局公务员考试《行政职业能力测验》历年真题及详解.docx
- 2023年河北省保定市安国市信访局公务员考试《行政职业能力测验》历年真题及详解.docx
- 信息必刷卷03(广东省专用)(解析版).docx
- 信息必刷卷02(天津专用)(原卷版).docx
- 信息必刷卷03(安徽专用)(原卷版).docx
- 热点08 工艺流程题 -2024年中考化学【热点·重点·难点】专练(江苏专用)(解析版).docx
- 专题06 比较异同类选择题(含答题技巧,题型专练60题)(解析版).docx
- 专题09 推断题、工业流程题、溶解度曲线题(解析版).docx
- 信息必刷卷04(湖南专用)(解析版).docx
- 信息必刷卷01(福建专用)(原卷版).docx
文档评论(0)