卫生统计学:13logistic-回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 实例分析 * * * * * * * * logistic回归的应用及其注意事项 一、logistic回归的应用 1. 流行病学危险因素分析 logistic回归分析参数的流行病学含义清楚,即得到某一危险因素的回归系数 后,可以方便的估计出该因素在不同水平下的OR值或近似RR值,非常适合于流行病学研究。 在流行病学危险因素研究中,为了排除混杂因素的影响,可以通过拟合包含多变量的logistic回归模型,得到调整后的优势比。 * * 2. 临床试验数据分析 临床评价某种药物或治疗方法的效果,非处理因素在试验组和对照组间分布不均衡,就有可能夸大或掩盖实验组的治疗效果。 尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组间的分布仍可能不均衡,需要在分析阶段对构成混杂的因素进行调整,当评价指标为两分类变量时,可以利用logistic回归分析得到调整后的药物或某种治疗方法的评价结果。 * * 3.预测与判别 Logistic回归模型是一个概率型模型,对非条件Logistic回归,在给定的条件下可通过logistic回归模型计算某事件发生的概率。因此可以利用它预测某事件发生的概率。在临床上也可以根据疾病与临床检查指标资料,建立logistic回归模型,对新的对象可根据其临床检查指标,计算其患某种疾病的概率的大小,进行判别分析。 * * 某患者吸烟(x2=1),胆固醇水平(x4=5.7) 高密度脂蛋白(x7=2.0) ,则该患者多发腔隙性脑梗死的概率是P=? * * 二、注意事项 1、数值变量资料的赋值 若自变量是数值变量,最好将其按变量值的大小分成几组,按顺序赋值为1,2,3…k,否则参数的实际意义可能不明确。 例如,对于年龄变量,如果利用实际数值则求出的OR值表示年龄每增加一岁时的优势比,实际意义不大。 * * 如果将年龄分成几个不同的水平(年龄段),就比较容易解释,处理上也比较灵活,分析时既可以按得分处理,也可以将其化作k-1个哑变量(dummy variable) 哑变量法强调参数解释,其他各水平的恰为相对水平1的优势比;任意两水平的优势比可以由相应的回归系数之差得到。 * * 年龄段 x=1,2,3,4 年龄(岁)xage 以第一年龄段为参考设哑变量d1、d2、d3 ,以三个哑变量拟合方程,得到: * * 2、因变量赋值 与分类变量赋值方法相同,但需注意“阳性反应”的赋值,如果因变量赋值的顺序相反,回归系数绝对值不变,但符号相反。在SAS软件的logistic过程步中可加选项“des”或“descending”实现。 “proc logistic des;” * * 3、样本含量 logistic回归统计推断是建立在大样本基础上的,要求有足够的样本含量。经验上病例和对照的人数应至少各有30~50例,模型中变量个数越多,需要的样本含量越大。 观察对象的个数是自变量个数的10-20倍 * * 小结 * * Logistic回归分析 胡利人 流行病与卫生统计学教研室 * * 回归分析的分类 多个因变量 (y1,y2,…yk) 路径分析 结构方程模型分析 一个因变量 y 连续型因变量 (y) --- 线性回归分析 分类型因变量 (y) ---Logistic 回归分析 时间序列因变量 (t) ---时间序列分析 生存时间因变量 (t) ---生存风险回归分析 * * 医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重线性回归的条件 什么情况下采用Logistic回归? * * logistic回归(logistic regression)是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。 在分析疾病与各种危险因素间的定量关系,同时为了能真实反映暴露因素与观察结果间的关系,需要控制混杂因素的影响,已知主要控制混杂的方法包括:分层分析和多重回归。 * * 控制混杂因素的方法 (1)Mantel-Haenszel分层分析:适用于样本量大、分析因素较少的情况。 当分层较多时,由于要求各格子中例数不能太少,所需样本较大,往往难以做到; 当混杂因素较多时,分层数也呈几何倍数增长,这将导致部分层中某个格子的频数为零,无法利用其信息。 * * * * 按饮酒与否分层计算OR值 * *

文档评论(0)

jyr0221 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档