网站大量收购独家精品文档,联系QQ:2885784924

16第16章(全C)logistic回归分析20110910.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第16章 logistic回归分析 主讲 程 琮 Chinese Teaching Plan for Medical Students Medical Statistics 研究生用《医学统计学》 孙振球 主编 人民卫生出版社 2005年8月第2版 第十六章 logistic回归 第一节 logistic回归 1。概念:logitic回归(logistic regression)属于概率型非线性回归,它是研究二分类变量与一些影响因素之间关系的一种多变量分析方法 。 2。用途:①病因学分析 ②疾病预后分析 ③鉴别诊断 ④临床试验评价 ⑤治疗措施评价 ⑥毒物或药物的剂量-反应分析 ⑦疾病危险因素评价等。现已成为分析和处理二分类反应变量的常用方法。 3。学习方法:logistic回归模型复杂,要熟悉其基本原理和方法,主要是掌握医学的实际应用,并能合理解释统计分析结果并作出结论。 4。注意: 1)一般情况下,Y为二分类结果:如生与死;有病或无病; 2)Y亦可为多分类,或有序分类结果:如疗效分级;病情的分级等。 logistic回归模型 3)有下列模型:其中取对数后,变为线性(公式16-2)。 4)。其中有logit变换,即下列公式: 模型参数的意义 2。模型参数的意义: 1)比数(odds):发病概率与不发病概率之比。即 P/(1-P)。 2)设:暴露组发病率为P1,非暴露组发病率为P0,则两组比数的之比称为比数比或优势比。(odds ratio)。用OR来表示。 3)当慢性病如心脑血管病、恶性肿瘤等发病率很低时,即P1时,则OR值可作为RR值(相对危险度relative risk)的近似估计值,见公式16-6。 当X取值为1和0时,右边的公式: 公式16-5的意义:非常重要,要完全掌握。 1。当βj = 0时,Orj = 1,说明Xj对发病不起作用。 2。当βj 0时,ORj 1,说明Xj对发病是一个危险因素; 3。当βj 0时,ORj 1,说明Xj对发病是一个保护因素。 βj的意义:当暴露因素Xj改变一个单位所引起的比数比自然对数的改变量。即OR=exp(βj )。 例: βj的意义及计算: 二、logistic回归模型的参数估计 1。参数的估计:用最大似然法(maximum likelihood estimate)。只要了解就可以。不必深入探究。 分层资料的似然函数 2。优势比估计: 例16-1 表16-1是一个研究吸烟、饮洒与食管癌关系的病例-对照资料。试作logistic回归分析。 分析: 1。按照有无吸烟和饮酒,组合成4种情况。此为分层。将每种情况的例数、阳性数和阴性数列于表16-1中。 2。代码0为不吸烟,不饮酒;代码1为吸烟和饮酒。 3。计算过程:用统计软件以电脑计算得出结果。 计算结果:一般有OR值及可信区间。 论文中一般是列表的形式显示结果。 三、 logistic回归模型的假设检验 1。对回归系数的检验: 1)对所有回归系数的检验; 2)对某一个回归系数的检验。 2。检验方法:有三个。 1)似然比检验; 2)Wald 检验; 3)计分检验:比较复杂。 下面是两种检验的公式: 检验结果: 1)似然比检验:各因素的G 3.84,P0.05。说明:吸烟、饮酒均与食管癌有关。 2)Wald检验:卡方值(34.86, 11.20)均大于3.84,P0.05。结论同前。 3)计分检验:省略。 四、变量筛选 1。方法:应用逐步回归法。检验公式为16-4。 下表为各种变量取值。 1。取值一般有习惯取法。也可以任意取值。但要取的值使用方便。如取整数或较小的值。 2。年龄和体重指数:变为等级资料,其它变量为二分类变量。 上表数据有省略。以免占太多空间。原始数据见书第262-263页。 结果: 1。经电脑计算,选出4个变量与冠心病发生有关。e的次方即为OR值。 2。表中显示:OR值均大于1。说明均为冠心病发生的危险因素。 3。标准化回归系数b’:可以直接各变量的作用大小(已无量纲)。 4。上表模式:很重要。发表论著、论文等均以此模式为惯例。 第二节 条件logistic回归 (conditional logistic regression) 下表为变量取值。有二分类变量、等级变量。 注意:第一列的序号为匹配组。第1个匹配组有3个人。1个病人2个对照。余类推。共25个匹配组。 经电脑统计软件计算:结果如下。 1。方程中选入4个变量。其中X4为摄食新鲜蔬菜,其OR值小于1,为保护因素。其它均为危险因素。 2。使用了Wald卡方检验法。 第三节 回归的应用及其注意事项 一、应用 1。流行病学危险因素分析: 适合于:1)队列研究;2)病例-对照研究;3)横断面研究。 2。临床试验数据分析

文档评论(0)

liudao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档