- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
10logistic回归(研)解析
Logistic回归分析 胡利人 流行病与卫生统计学教研室 logistic回归(logistic regression)是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。 在分析疾病与各种危险因素间的定量关系,同时为了能真实反映暴露因素与观察结果间的关系,需要控制混杂因素的影响,已知主要控制混杂的方法包括:分层分析和多重回归。 控制混杂因素的方法 (1)Mantel-Haenszel分层分析:适用于样本量大、分析因素较少的情况。 当分层较多时,由于要求各格子中例数不能太少,所需样本较大,往往难以做到; 当混杂因素较多时,分层数也呈几何倍数增长,这将导致部分层中某个格子的频数为零,无法利用其信息。 按饮酒与否分层计算OR值 (2)线性回归分析: 由于因变量是分类变量,不能满足其正态性要求;有些自变量对因变量的影响并非线性。 logistic回归:研究某个二分类(或无序及有序多分类)目标变量与有关因素的关系,不仅适用于病因学分析,也可用于其他方面的研究 。 logistic回归的分类: (1)二分类资料logistic回归 非条件logistic回归 条件logistic回归(配对或配比资料) (2)多分类资料logistic回归 非条件logistic回归 用途 Logistic回归模型的构造 偏回归系数βj 的流行病学意义 对于发病率很低的慢性疾病如心脑血管病、恶性肿瘤等,优势比可作为相对危险度(relative risk , RR)的近似估计。 即: 参数估计与假设检验 logistic回归模型的假设检验 变量筛选 实例分析 SAS程序 data a; input x1 x2 x3 x4 x5 x6 x7 y; cards; 0 0 1 5.65 2.34 3.61 1.98 0 0 0 0 6.23 3.89 2.11 0.99 0 1 0 1 5.14 2.73 2.88 1.02 0 ………………… 0 0 0 4.3 1.79 2.64 1.3 1 1 1 0 3.35 0.81 1.68 1.3 1 1 1 0 4.78 1.4 2.15 0.99 1 1 1 0 5.23 1.12 3.69 1.03 1 1 1 0 2.89 1.2 1.95 1.39 1 ; proc logistic des; model y=x1-x7; run; 逐步回归分析 proc logistic des; model y=x1-x7/stb selection=stepwise sle=0.1 sls=0.1; run; logistic回归的应用及其注意事项 小结 指定选项“des”是为了按照y=1(患病)的概率拟合模型。如果不加此选择项,则软件会按照y=0(非患病)的概率拟合模型,此时,应变量的排序水平发生颠倒,且所有参数估计的符号相反,OR值为原来的倒数。 用逐步回归法拟合模型,变量选入和剔除水平均为0.10 logistic逐步回归分析筛选出三个有统计学意义的变量为x2、x4和x7,回归系数分别为1.7324、-2.1630和4.2578。吸烟(x2)的优势比5.645,表示在控制其他因素后吸烟者 (x2=1)发生该病的危险性是不吸烟者(x2=0)的5.645倍胆固醇(x4)是保护因素,表示控制其他因素影响后,胆固醇每增加一个单位发生该病的危险性是原来的0.115倍。 结果中还给出了标准化偏回归系数,高密度脂蛋白(x7)引起腔隙性脑梗死多发的危险性大于吸烟(x2),而胆固醇(x4)是保护因素。 一、logistic回归的应用 1. 流行病学危险因素分析 logistic回归分析参数的流行病学含义清楚,即得到某一危险因素的回归系数 后,可以方便的估计出该因素在不同水平下的OR值或近似RR值,非常适合于流行病学研究。 在流行病学危险因素研究中,为了排除混杂因素的影响,可以通过拟合包含多变量的logistic回归模型,得到调整后的优势比。 2. 临床试验数据分析 临床评价某种药物或治疗方法的效果,非处理因素在试验组和对照组间分布不均衡,就有可能夸大或掩盖实验组的治疗效果。 尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组间的分布仍可能不均衡,需要在分析阶段对构成混杂的因素进行调整,当评价指标为两分
文档评论(0)