SPSSlogistic回归分析.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSSlogistic回归分析

所谓Logistic模型,或者说Logistic回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在0~1之间,回归方程的应变量取值可是在实数集中,直接做会出现0~1范围之外的不可能结果,因此就有人耍小聪明,将率做了一个Logit变换,这样取值区间就变成了整个实数集,作出来的结果就不会有问题了,从而该方法就被叫做了Logistic回归。随着模型的发展,Logistic家族也变得人丁兴旺起来,除了最早的两分类Logistic外,还有配对Logistic模型,多分类Logistic模型、随机效应的Logistic模型等。由于SPSS的能力所限,对话框只能完成其中的两分类和多分类模型,下面我们就介绍一下最重要和最基本的两分类模型。10.3.1 界面详解与实例例11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析(本例来自《卫生统计学》第四版第11章)。i:标本序号x1:确诊时患者的年龄(岁)x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级?x3:肾细胞癌组织内微血管数(MVC)?x4:肾癌细胞核组织学分级,由低到高共4级?x5:肾细胞癌分期,由低到高共4期?y:肾细胞癌转移情况(有转移y=1; 无转移y=0)。?I ?x1? x2 ?x3? x4 ?x5 ?y1? 59? 2? 43.4? 2? 1 ?02 ?36? 1? 57.2? 1 ?1? 03? 61? 2 ?190 2? 1? 04? 58? 3 ?128 4? 3 ?15? 55? 3 ?80 3 ?4 ?16 ?61? 1? 94.4? 2? 1? 07? 38? 1? 76 1 ?1 ?08? 42 ?1? 240 3 ?2 ?09? 50? 1? 74 1? 1 ?010? 58? 3? 68.6? 2? 2? 011? 68? 3? 132.8? 4? 2? 0 12? 25? 2? 94.6? 4? 3? 113? 52? 1? 56 1? 1? 014? 31? 1? 47.8? 2? 1? 015? 36? 3? 31.6? 3? 1? 116? 42? 1? 66.2? 2? 1? 017? 14? 3? 138.6? 3? 3? 118? 32? 1? 1142? 3? 019? 35? 1? 40.2? 2? 1? 020? 70? 3? 177.2? 4 ?3? 121? 65? 2? 51.6? 4? 4? 122? 45? 2? 124 2? 4 ?023? 68? 3? 127.2? 3 ?3? 124? 31? 2? 124.8 ?2 ?3? 025? 58? 1? 128 4? 3? 026? 60? 3? 149.8? 4? 3? 1在菜单上选择Analyze==》Regression==》Binary Logistic...,系统弹出Logistic回归对话框如下:左侧是候选变量框,右上角是应变量框,选入二分类的应变量,下方的Covariates框是用于选入自变量的,只不过这里按国外的习惯被称为了协变量。两框中间的是BLOCK系列按扭,我在上一课已经讲过了,不再重复。中下部的a*b框是用于选入交互作用的,和其他的对话框不太相同(我也不知道为什么SPSS偏在这里做得不同),下方的Method列表框用于选择变量进入方法,有进入法、前进法和后退法三大类,三类之下又有细分。最下面的四个按钮比较重要,请大家听我慢慢道来:Select钮:用于限定一个筛选条件,只有满足该条件的记录才会被纳入分析,单击它后对话框会展开让你填入相应的条件。不过我觉得该功能纯属多余,和专门的Select对话框的功能重复了。Categorical钮:如果你的自变量是多分类的(如血型等),你必须要将它用哑变量的方式来分析,那么就要用该按钮将该变量指定为分类变量,如果有必要,可用里面的选择按钮进行详细的定义,如以哪个取值作为基础水平,各水平间比较的方法是什么等。当然,如果你弄不明白,不改也可以,默认的是以最大取值为基础水平,用Deviance做比较。Save钮:将中间结果存储起来供以后分析,共有预测值、影响强度因子和残差三大类。Options钮:这一部分非常重要,但又常常被忽视,在这里我们可以对模型作精确定义,还可以选择模型预测情况的描述方式,如Statistics and Plots中的Classification plots就是非常重要的模型预测工具,Correlations of estimates则是重要的模型诊断工具,Iteration history可以看到迭代的具体情况,从而得知你的模型是否在迭代时存在病态

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档