- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
.Logistic回归模型
Logistic 回归模型 赵耐青 复旦大学公共卫生学院 数据分析的背景 计量资料单因素统计分析 对于两组计量资料的比较,一般采用t检验或秩和检验。 对于两个变量的相关分析采用Pearson相关分析或Spearman相关分析 考虑多因素的影响,对于应变量(反应变量)为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。 数据分析的背景 单因素的分类资料统计分析,一般采用Pearson ?2进行统计检验,用Odds Ratio及其95%可信区间评价关联程度。 考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型P=a+bx就不合适了,应选用Logistic回归模型进行统计分析。 Logistic回归模型 按研究设计分类 非配对设计:非条件Logistic回归模型 配对的病例对照:条件Logistic回归模型 按反应变量分类 二分类Logistic回归模型(常用) 多分类无序Logistic回归模型 多分类有序Logistic回归模型 基础知识 通过下例引入和复习相关概念 例如:研究患某疾病与饮酒的关联性 患病率 P1=a/m1 P2=b/m2 基础知识 Odds(优势) 基础知识 P与Odds一一对应 对于两个Odds的比较,一般用它们的Ratio,并称为Odds Ratio(OR),其定义如下: 其样本估计统计量为 基础知识 故比较两个率== 比较OR =1? OR1 ? OR1? (二分类)Logistic回归模型 因为0Odds+? 所以 -? ln(Odds) +? 对ln(Odds)引入类似多重线性回归的表达式 Logistic回归模型 记: 故可以写为 也可以写为 回归系数的意义 以x1的回归系数?1为例 固定其它自变量,比较x1与x1 +1的ln(Odds)变化。 对于x1, 对于x1 +1, 反对数变换得到 实例1 实例1 饮酒的患病率和Odds分别为 实例1的Logistic回归模型 患病(Y=1)的概率为 x=1 表示饮酒,x=0表示不饮酒 回归系数?0,?1是未知参数,通常用最大似然估计的方法。 实例1:患病与未患病的概率 饮酒(x=1),患病概率和未患病概率分别 为 不饮酒(x=0),患病概率和未患病概率分别为 实例1:最大似然估计 本例的似然函数 选择?0和?1使似然函数L达到最大,即最大似然估计。 实例1:用Logistic模型进行统计分析 以上述实例资料用Stata统计软件对回归系数进行最大似然估计,得到回归系数估计为 即: Logistic模型的单个回归系数检验 关键是如果?=0,意味自变量X与Y无关联性。由于?的估计存在抽样误差,即使?=0,其估计值b一般不为0,故需检验?=0? H0: ?=0 H1: ??0 ?=0.05 检验统计量 可以证明: H0:?=0 为真时,z近似服从标准正态分布,即:|z|1.96,P0.05,拒绝H0 实例1:用Logistic模型进行统计分析 实例1的回归系数估计为 se(b)=0.1780719, z=b/se=2.31 ,P=0.0210.05 拒绝H0,差异有统计学意义,可认为??0。 饮酒与患AMI的关联性为 OR的95%可信区间为(1.06,2.14) 应用Logistic模型校正混杂作用 实例2:上例没有考虑吸烟情况,故将吸烟作为分层加入,资料如下: 实例2:应用Logistic模型校正混杂作用 从分层的资料表述可知:由于吸烟的混杂作用以致饮酒与AMI患病伴随有关联。 用x1=1和0分别表示饮酒和不饮酒,用x2=1和0分别表示吸烟和不吸烟,Logistic模型表示如下 Logistic模型的似然比检验 在多个自变量回归模型中,回归系数检验分为单个回归系数检验和多个回归系数检验。 单个回归系数检验表示其它变量均在模型中的情况下,检验某个回归系数?i=0,一般用Wald检验(如实例1)。 多个回归系数检验要用似然比方法(likelihood ratio test) Logistic模型的似然比检验 多个回归系数的检验(以实例2为例) H0:?1=?2=0 H1:?1,?2不全为0 ?=0.05 H0为真时,模型为 用最大似然法进行估计,其对数最大似然函数值(似然函数的最大值取对数)记为ln(L0) Logistic模型的似然比检验 H1为真时,实例2的模型为 用最大似然法进行估计,其对数最大似然函数值记为ln(L1) 记似然比检验统计量为2ln(L)=
文档评论(0)