SPSS二元Logistic回归教程案例分析.pdfVIP

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

学习二元Logistic回归有一段时间了,今天跟大家分享一下学习心得,希望多指教!

二元Logistic,从字面上其实就可以理解大概是什么意思,Logistic中文意思为“逻辑”但是这里,并不是逻辑的意思,

而是通过logit变换来命名的,二元一般指“两种可能性”就好比逻辑中的“是”或者“否”一样,

Logistic回归模型的假设检验——常用的检验方法有似然比检验(likelihoodratiotest)和Wald检验)

似然比检验的具体步骤如下:

1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0

2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InL1

3:最后比较两个对数似然函数值的差异,若两个模型分别包含l个自变量和P个自变量,记似然比统计量G的计算公式为

G=2(InLP-InLl).在零假设成立的条件下,当样本含量n较大时,G统计量近似服从自由度为V=P-l的x平方分布,如果

只是对一个回归系数(或一个自变量)进行检验,则v=1.

wald检验,用u检验或者X平方检验,推断各参数βj是否为0,其中u=bj/Sbj,X的平方=(bj/Sbj),Sbj为回归系数的标

准误

这里的“二元”主要针对“因变量”所以跟“曲线估计”里面的Logistic曲线模型不一样,二元logistic回归是指因变量为

二分类变量是的回归分析,对于这种回归模型,目标概率的取值会在(0-1),但是回归方程的因变量取值却落在实数集当

中,这个是不能够接受的,所以,可以先将目标概率做Logit变换,这样它的取值区间变成了整个实数集,再做回归分析就

不会有问题了,采用这种处理方法的回归分析,就是Logistic回归

设因变量为y,其中“1”代表事件发生,“0”代表事件未发生,影响y的n个自变量分别为x1,x2,x3xn等等

记事件发生的条件概率为P

那么P=事件未发生的概理为1-P

事件发生跟”未发生的概率比为(p/1-p)事件发生比,记住Odds

将Odds做对数转换,即可得到Logistic回归模型的线性模型:

还是以教程“blankloan.sav数据为例,研究银行客户贷款是否违约(拖欠)的问题,数据如下所示:

上面的数据是大约700个申请贷款的客户,我们需要进行随机抽样,来进行二元Logistic回归分析,上图中的“0”表示没

有拖欠贷款,“1”表示拖欠贷款,接下来,步骤如下:

1:设置随机抽样的随机种子,如下图所示:

选择“设置起点”选择“固定值”即可,本人感觉200万的容量已经足够了,就采用的默认值,点击确定,返回原界面、

2:进行“转换”—计算变量“生成一个变量(validate),进入如下界面:

在数字表达式中,输入公式:rv.bernoulli(0.7),这个表达式的意思为:返回概率为0.7的bernoulli分布随机值

如果在0.7的概率下能够成功,那么就为1,失败的话,就为0

为了保持数据分析的有效性,对于样本中“违约”变量取缺失值的部分,validate变量也取缺失值,所以,需要设置一个

“选择条件”

点击“如果”按钮,进入如下界面:

如果“违约”变量中,确实存在缺失值,那么当使用missing”函数的时候,它的返回值应该为“1”或者为“true,为

了剔除”缺失值“所以,结果必须等于“0“也就是不存在缺失值的现象

点击”继续“按钮,返回原界面,如下所示:

将是“是否曾经违约”作为“因变量”拖入因变量选框,分别将其他8个变量拖入“协变量”选框内,在方法中,选择:

forward.LR方法

将生成的新变量“validate拖入选择变量“框内,并点击”规则“设置相应的规则内容,如下所示:

设置validate值为1,此处我们只将取值为1的记录纳入模型建立过程,其它值(例如:0)将用来做结论的验证或者预测分

析,当然你可以反推,采用0作为取值记录

点击继续,返回,再点击“分类”按钮,进入如下页面

在所有的8个自变量中,只有“教育水平”这个变量能够作为“分类协变量”因为其它变量都没有做分类,本例中,教育水

平分为:初中,高中,大专,本科,研究生等等,参考类别选择:“最后一个”在对比中选择“指示符”点击继续按

钮,返回

再点击—“保存”按钮,进入界面:

在“预测值中选择”概率,在“影响”中选择“Cook距离”在“残差”中选择“学生化”

文档评论(0)

idowen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档