SPSS二元Logistic回归教程案例分析.pdfVIP

下载本文档

0
0
约6.29千字
约 17页
2024-06-26 发布于北京
举报
版权申诉

SPSS二元Logistic回归教程案例分析.pdf

1、本文档共17页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

学习二元Logistic回归有一段时间了，今天跟大家分享一下学习心得，希望多指教！

二元Logistic，从字面上其实就可以理解大概是什么意思，Logistic中文意思为“逻辑”但是这里，并不是逻辑的意思，

而是通过logit变换来命名的，二元一般指“两种可能性”就好比逻辑中的“是”或者“否”一样，

Logistic回归模型的假设检验——常用的检验方法有似然比检验（likelihoodratiotest）和Wald检验）

似然比检验的具体步骤如下：

1：先拟合不包含待检验因素的Logistic模型，求对数似然函数值INL0

2：再拟合包含待检验因素的Logistic模型，求新的对数似然函数值InL1

3:最后比较两个对数似然函数值的差异，若两个模型分别包含l个自变量和P个自变量，记似然比统计量G的计算公式为

G=2(InLP-InLl).在零假设成立的条件下，当样本含量n较大时，G统计量近似服从自由度为V=P-l的x平方分布，如果

只是对一个回归系数（或一个自变量）进行检验，则v=1.

wald检验，用u检验或者X平方检验，推断各参数βj是否为0，其中u=bj/Sbj,X的平方=（bj/Sbj),Sbj为回归系数的标

准误

这里的“二元”主要针对“因变量”所以跟“曲线估计”里面的Logistic曲线模型不一样，二元logistic回归是指因变量为

二分类变量是的回归分析，对于这种回归模型，目标概率的取值会在（0-1），但是回归方程的因变量取值却落在实数集当

中，这个是不能够接受的，所以，可以先将目标概率做Logit变换，这样它的取值区间变成了整个实数集，再做回归分析就

不会有问题了，采用这种处理方法的回归分析，就是Logistic回归

设因变量为y,其中“1”代表事件发生，“0”代表事件未发生，影响y的n个自变量分别为x1,x2,x3xn等等

记事件发生的条件概率为P

那么P=事件未发生的概理为1-P

事件发生跟”未发生的概率比为(p/1-p)事件发生比，记住Odds

将Odds做对数转换，即可得到Logistic回归模型的线性模型：

还是以教程“blankloan.sav数据为例，研究银行客户贷款是否违约（拖欠）的问题，数据如下所示：

上面的数据是大约700个申请贷款的客户，我们需要进行随机抽样，来进行二元Logistic回归分析，上图中的“0”表示没

有拖欠贷款，“1”表示拖欠贷款，接下来，步骤如下：

1：设置随机抽样的随机种子，如下图所示：

选择“设置起点”选择“固定值”即可，本人感觉200万的容量已经足够了，就采用的默认值，点击确定，返回原界面、

2：进行“转换”—计算变量“生成一个变量（validate)，进入如下界面：

在数字表达式中，输入公式：rv.bernoulli（0.7），这个表达式的意思为：返回概率为0.7的bernoulli分布随机值

如果在0.7的概率下能够成功，那么就为1，失败的话，就为0

为了保持数据分析的有效性，对于样本中“违约”变量取缺失值的部分，validate变量也取缺失值，所以，需要设置一个

“选择条件”

点击“如果”按钮，进入如下界面：

如果“违约”变量中，确实存在缺失值，那么当使用missing”函数的时候，它的返回值应该为“1”或者为“true，为

了剔除”缺失值“所以，结果必须等于“0“也就是不存在缺失值的现象

点击”继续“按钮，返回原界面，如下所示：

将是“是否曾经违约”作为“因变量”拖入因变量选框，分别将其他8个变量拖入“协变量”选框内，在方法中，选择：

forward.LR方法

将生成的新变量“validate拖入选择变量“框内，并点击”规则“设置相应的规则内容，如下所示：

设置validate值为1，此处我们只将取值为1的记录纳入模型建立过程，其它值（例如：0）将用来做结论的验证或者预测分

析，当然你可以反推，采用0作为取值记录

点击继续，返回，再点击“分类”按钮，进入如下页面

在所有的8个自变量中，只有“教育水平”这个变量能够作为“分类协变量”因为其它变量都没有做分类，本例中，教育水

平分为：初中，高中，大专，本科，研究生等等,参考类别选择：“最后一个”在对比中选择“指示符”点击继续按

钮，返回

再点击—“保存”按钮，进入界面：

在“预测值中选择”概率，在“影响”中选择“Cook距离”在“残差”中选择“学生化”

您可能关注的文档

文档评论（0）

idowen + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

SPSS二元Logistic回归教程案例分析.pdfVIP