Logistic回归的实际应用.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Logistic回归的实际应用

Logistic回归的介绍与实际应用 摘要 本文通过对logistic回归的介绍,对logistic回归模型建立的分析,以及其在实际生活中的运用,我们可以得出所建立的模型对实际例子的数据拟合结果不错。 关键词:logistic回归;模型建立;拟合; logistic回归的简要介绍 1、Logistic回归的应用范围: ①?????适用于流行病学资料的危险因素分析 ②?????实验室中药物的剂量-反应关系 ③?????临床试验评价 ④?????疾病的预后因素分析 2、?Logistic回归的分类: ①?????按因变量的资料类型分:二分类、多分类;其中二分较为常用 ②?????按研究方法分:条??件Logistic回归、非条件Logistic回归 两者针对的资料类型不一样,后者针对成组研究,前者针对配对或配伍研究。 3、Logistic回归的应用条件是: ①?????独立性。各??测对象间是相互独立的; ②?????Logit P与自变量是线性关系; ③?????样本量。经验值是病例对照各50例以上或为自变量的5-10倍(以10倍为宜),不过随着统计技术和软件的发展,样本量较小或不能进行似然估计的情况下可采用精确logistic回归分析,此时要求分析变量不能太多,且变量分类不能太多; ④?????当队列资料进行logistic回归分析时,观察时间应该相同,否则需考虑观察时间的影响(建议用Poisson回归)。 4、拟和logistic回归方程的步骤: ①?????对每一个变量进行量化,并进行单因素分析; ②?????数据的离散化,对于连续性变量在分析过程中常常需要进行离散变成等级资料。可采用的方法有依据经验进行离散,或是按照四分、五分位数法来确定等级,也可采用聚类方法将计量资料聚为二类或多类,变为离散变量。 ③?????对性质相近的一些自变量进行部分多因素分析,并探讨各自变量(等级变量,数值变量)纳入模型时的适宜尺度,及对自变量进行必要的变量变换; ④?????在单变量分析和相关自变量分析的基础上,对P≤α(常取0.2,0.15或0.3)的变量,以及专业上认为重要的变量进行多因素的逐步筛选;模型程序每拟合一个模型将给出多个指标值,供用户判断模型优劣和筛选变量。可以采用双向筛选技术:a进入变量的筛选用score统计量或G统计量或LRS(似然比统计量),用户确定P值临界值如:0.05、0.1或0.2,选择统计量显著且最大的变量进入模型;b剔除变量的选择用Z统计量(Wald统计量),用户确定其P值显著性水平,当变量不显者,从模型中予以剔除。这样,选入和剔除反复循环,直至无变量选入,也无变量删除为止,选入或剔除的显著界值的确定要依具体的问题和变量的多寡而定,一般地,当纳入模型的变量偏多,可提高选入界值或降低剔除标准,反之,则降低选入界值、提高删除标准。但筛选标准的不同会影响分析结果,这在与他人结果比较时应当注意。 ⑤?????在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项;两变量间的交互作用为一级交互作用,可推广到二级或多级交互作用,但在实际应用中,各变量最好相互独立(也是模型本身的要求),不必研究交互作用,最多是研究少量的一级交互作用。 ⑥?????对专业上认为重要但未选入回归方程的要查明原因。 5、回归方程拟合优劣的判断(为线性回归方程判断依据,可用于logistic回归分析) ①?????决定系数(R2)和校正决定系数(??),可以用来评价回归方程的优劣。R2随着自变量个数的增加而增加,所以需要校正;校正决定系数(?)越大,方程越优。但亦有研究指出R2是多元线性回归中经常用到的一个指标,表示的是因变量的变动中由模型中自变量所解释的百分比,并不涉及预测值与观测值之间差别的问题,因此在logistic回归中不适合。 ②?????Cp选择法:选择Cp最接近p或p+1的方程(不同学者解释不同)。Cp无法用SPSS直接计算,可能需要手工。1964年CL Mallows提出: ? ?????? Cp接近(p+1)的模型为最佳,其中p为方程中自变量的个数,m为自变量总个数。 ③?????AIC准则:1973年由日本学者赤池提出AIC计算准则,AIC越小拟合的方程越好。 在logistic回归中,评价模型拟合优度的指标主要有Pearson?χ2、偏差(deviance)、Hosmer- Lemeshow (HL)指标、Akaike信息准则(AIC)、SC指标等。Pearson?χ2、偏差(deviance)主要用于自变量不多且为分类变量的情况

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档