- 27
- 0
- 约1.15千字
- 约 4页
- 2016-11-29 发布于重庆
- 举报
多分类Logistic回归
多分类Logistic回归
步骤:
Analyze——Regression——multinomial logistic regression,将应变量“结果”调入dependent,由于所有自变量均为分类变量,所以将“感染时间”、ALT、病毒载量、alt一过、病毒下降,所有自变量调入factor,其他均采用默认操作,点OK,最终结果如下:
(你发给我的结果我没打开,所以怕你也打不开,我截图了啊)。
到这里,回归操作已经进行完毕,接下来根据得到的以上回归结果进行预测。
在做多分类logistic回归时,如果应变量Y有n个值,以其中一个类别做为参考类别(baseline category),其他类别都同它相比较生成n-1个非冗余的logit变量模型。如,y=n做为参考类别,则对于y=i,其logit模型为:
(公式1)
对于参考类别,其模型中所有系数均为0. SPSS中默认将最大类别做为参考类别。本例应变量y分三类:1=联合应答,2=部分应答,3=不应答。因此,将3=不应答做为应变量的参考类别。所以,出现结果方框下第一行字:The reference category is:3不应答。因为“3不应答”做了参考类别,所以“3不应答”的所有系数均为0,所以执行结果中不显示。
同样,感染时间=3、病毒载量=3、基因型=3、alt一过=2、病毒下降=2、alt=3,分别做为各个自变量的参考变量,其系数也均为0.
回归的目的是为了预测。假设已知一患者,其感染时间=1,病毒载量=2,基因型=1,alt一过=1,病毒下降=1,alt=2,预测该患者的结果是联合应答、部分应答、不应答的可能性分别是多大?
第一步:根据公式1计算各种应答水平的g值。
对于联合应答:g1=-2.813+3.056+0.439+1.059+0.392+2.290-1.501=2.922
对于部分应答:g2=-1.104+1.829-0.125-0.737-0.214+1.491-1.389=-0.249
对于不应答:g3=0. 因为不应答组是应变量y的参考组,所有系数均为0.
第二步:根据公式2计算各种应答水平的P值。
(公式2)
P(联合应答)=e2.922/(e2.922+e-0.249+e0)=A
P(部分应答)= e-0.249/(e2.922+e-0.249+e0)=B
P(不应答)= e0/(e2.922+e-0.249+e0)=C
A+B+C=1
因此,该患者联合应答的可能性是A,部分应答的可能性是B,不应答的可能是C。
预测结束。
回归结果中,exp(B)的解释,如第二行21.243,表示对于结果是联合应答而不是不应答这种情况,感染时间1是感染时间3的21.243倍。
原创力文档

文档评论(0)