第十六章--Logistic回归.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
希望: 1.掌握软件基本操作 2.及时消化课堂知识 3.尽早开始迎考复习 * * 可通过散点图来判断 X1 、X2 、 … 、 Xm * * 4.变量的筛选 变量筛选的原则 专业上考虑 测量上考虑 共线性问题:计算相关矩阵,相关系数0.8-0.9,则选其一。 缺失数据少、测量误差低的优先选择 经验上考虑 双变量分析中有显著性的自变量(P ≤0.15) 选择那些改变主效应的自变量 二、logistic回归应用的注意事项 * 二、logistic回归应用的注意事项 5.交互作用的引入 交互作用的定义 当自变量和因变量的关系随第三个变量的变化而改变时,则存在交互作用 交互作用项的引入 基于临床实际认为对结果有重要影响 基于模型应用条件的分析 引入两个自变量的乘积项 交互作用的检验 交互作用的解释 * 二、logistic回归应用的注意事项 6.模型评价 模型评价包括两部分内容: 一是对模型中的每个自变量进行检验, 二是对所建立的回归方程进行拟合优度检验。 自变量检验应注意变量是否显著及作用的大小是相对的,因此通常分探索性研究和验证性研究两种情况加以说明。 对于探索性研究主要选择一个最佳的自变量组合,对于验证性研究则主要分析某一个自变量是否有统计学意义,为此需要对混杂因素进行调整。 * 7.关于模型的常数项 在大多数情况下,logistic回归模型常数项没有太大意义,所以不需要对常数项做解释和假设检验。只有在大规模的队列研究、临床诊断试验和疗效评价试验中,不同暴露层或处理组的阳性率与研究总体人群的分布一致时,常数项才有意义。 条件logistic回归中,常数项在建立条件似然函数时被约掉而得不到估计,所以条件logistic回归模型不能用于预测。 二、logistic回归应用的注意事项 * 8.输出结果的解释 回归系数的解释 系数的正负值:正(负)系数表示随自变量的增加因变量logit值的增加(减少)。 二分类自变量 系数为比数比的对数值,由此比数比=eb 多分类自变量 以第i类作参照,比较相邻或相隔的两个类别。 连续型自变量 当自变量改变一个单位时,比数比为eb 二、logistic回归应用的注意事项 * 8.输出结果的解释 模型拟合的优劣 自变量与结果变量(因变量)有无关系 确认因变量与自变量的编码 模型包含的各个自变量的临床意义 由模型回归系数计算得到的各个自变量的比数比的临床意义 二、logistic回归应用的注意事项 * 二、logistic回归应用的注意事项 9.多分类logistic回归 当因变量是一个多分类指标,特别是有序多分类指标时,如流行病学中某些慢性病的危险因素研究,观察结果为“无、轻、中、重”等不同等级资料,可以采用多分类logistic回归或有序多分类logistic进行分析。 * logistic回归的应用 疾病影响因素的研究 病因学研究:病例-对照研究、队列研究。研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。考察因素之间的交互作用。 影响因素的研究:横断面调查、临床试验 校正混杂因素 一般采用Mantel-Haenszel分层分析 分层较细或存在格子零频数时,M-H法无法采用。 logistic回归分析可有效精确地分析外部变量拥有的混杂和效应修正作用。 疾病预后的估计 logistic回归模型作为一种概率模型,可在队列研究中用于预测某事件发生的概率。 logistic回归不要求在因变量正态假设的前提下进行预测。 疾病诊断 疾病诊断二类间的判别 诊断性试验研究中,敏感度和特异度的估计 logistic回归模型综合校正协变量的影响 充分利用数据提供的信息 可进行95%可信区间的估计 * 理论上的不足:自变量对疾病的影响是独立的,但实际情况及推导结果不同。 模型有不合理性:“乘法模型”与一般希望的“相加模型”相矛盾。 样本含量不宜太少:例数大于200例时才可不考虑参数估计的偏性。 logistic回归的局限性 * 问题案例 某期刊2001年初发表的一篇有关狼疮脑病发生的相关因素分析,只对单因素分析中P值<0.05者进行多因素回归分析,结果只有血白细胞,尿红细胞和A/G比值3个因子进入Logistic回归方程,被认为是与红斑狼疮脑病发生的相关因素。 从风湿病专业的角度,估计很少有风湿科医生能接受这一研究结果。 分析其原因,可能是在建立多元回归方程时,待选变量的标准太严,导致真正有意义的因素被“埋没”。 类似这样,只取单因素分析中有意义的变量,进行多元回归分析的错误不是个别现象,在国内医学期刊中常常见到。 * logistic回归分析思路 变量的编码 哑变量的设置和引入 各个自变量的单因素分析 变量的筛选 交互作用的引入 建立

您可能关注的文档

文档评论(0)

哆啦 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档