- 55
- 0
- 约1.04万字
- 约 84页
- 2019-06-16 发布于浙江
- 举报
logistic回归分析 问题提出: 医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何? 因素(X) 疾病结果(Y) x1,x2,x3…XK 发生 Y=1 不发生 Y=0 例:暴露因素 冠心病结果 高血压史(x1):有 或无 有 或 无 高血脂史(x2): 有 或 无 吸烟(x3): 有或无 研究问题可否用多元线性回归方法? 1.多元线性回归方法要求 Y 的取值为计量的连续性随机变量。 2.多元线性回归方程要求Y与X间关系为线性关系。 3.多元线性回归结果 不能回答“发生与否” logistic回归方法补充多元线性回归的不足 Logistic回归方法 该法研究是 当 y 取某值(如y=1)发生的概率(p)与某暴露因素(x)的关系。 P(概率)的取值波动0~1范围。 基本原理:用一组观察数据拟合Logistic模型,揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系。 第一节??? logistic回归 1.基本概念 logistic回归要求应变量(Y)取值为分类变量(两分类或多个分类) 自变量(Xi)称为危险因素或暴露因素,可为连续变量、等级变量、分类变量。 可有m个自变量X1, X2,… Xm 2. logistic回归模型方程 一个自变量与Y关系的回归模型 如:y:发生=1,未发生=0 x : 有=1,无=0, 记为p(y=1/x)表示某暴露因素状态下,结果y=1的概率(P)模型。 几个logistic回归模型方程 logistic回归模型方程的线性表达 对logistic回归模型的概率(p)做logit变换, 在有多个危险因素(Xi)时 多个变量的logistic回归模型方程的线性表达: 2.模型中参数的意义 的含义:某危险因素,暴露水平变化时,即Xi=1与Xi=0相比,发生某结果(如发病)优势比的对数值。 危险因素 Y x= 1 x= 0 发病=1 30(a) 10( b) 不发病=0 70(c) 90(d) a+c b+d 危险因素 Y x= 1 x= 0 发病=1 p1 p0 不发病=0 1-p1 1-p0 多元回归模型的的 概念 反映了在其他变量固定后,X=1与x=0相比发生Y事件的对数优势比。 回归系数β与OR X与Y的关联 β=0,OR=1, 无关 β>1,OR>1 , 有关,危险因素 β<1,OR<1, 有关,保护因子 事件发生率很小,OR≈RR。 二、logistic回归模型的参数估计 1. 模型中的参数(βi)估计 通常用最大似然函数 (maximum likelihood estimate, MLE)估计β, 由统计软件包完成。 2. 优势比(OR)及可信区间的估计 如X=1,0两分类,则OR的1-α可信区间估计公式 例: 一个研究吸烟、饮酒与食道癌关系的病例-对照资料(886例),试作logistic回归分析。 变量的赋值 经logistic回归计算后得 b0 =-0.9099, b1 =0
原创力文档

文档评论(0)