SAS logistic 逻辑回归.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS logistic 逻辑回归

当因变量只有两个水平(如 生病/健康,成功/失败),多元回归的方法将不再适用。假设我们将因变量编码,1代表生病,0代表健康,我们希望回归能得到一个0到1之间的数字,代表被试生病或健康的概率是多少。但是多元回归会得到一个负值,或者大于1,这很难解释。 logistic回归可以处理这类问题。logistic回归采用logit转换是的预测方程得到0到1之间的值。logistic回归方程预测被试在某个分类中的优势的自然对数。另外,logistic回归方程的回归系数可以用于估计每个自变量的优势比。 逻辑回归(logistic regression)就是被逻辑方差归化后的线性回归。逻辑回归与线性回归不同,它可以处理分类变量。线性回归主要处理连续变量。例如:逻辑回归可以处理预测客户是(0)否(1)流失,这里的0、1就是分类变量;线性回归主要预测连续变量关系,提高广告投放,对产品销售的帮助曲线。 假设我们有一个数据,45个观测值,四个变量,包括: age(年龄,数值型); vision(视力状况,分类型,1表示好,0表示有问题); drive(驾车教育,分类型,1表示参加过驾车教育,0表示没有) accident一个分类型输出变量(去年是否出过事故,1表示出过事故,0表示没有)。我们的目的就是要考察前三个变量与发生事故的关系。 data logistic; input accident age vision drive @@; datalines; 1 17 1 1 1 4 4 0 0 1 48 1 0 1 55 0 0 1 75 1 1 0 35 0 1 0 4 2 1 1 0 57 0 0 0 28 0 1 0 20 0 1 0 38 1 0 0 4 5 0 1 0 47 1 1 0 52 0 0 0 55 0 1 1 68 1 0 1 1 8 1 0 1 68 0 0 1 48 1 1 1 17 0 0 1 70 1 1 1 7 2 1 0 1 35 0 1 1 19 1 0 1 62 1 0 0 39 1 1 0 4 0 1 1 0 55 0 0 0 68 0 1 0 25 1 0 0 17 0 0 0 4 5 0 1 0 44 0 1 0 67 0 0 0 55 0 1 1 61 1 0 1 1 9 1 0 1 69 0 0 1 23 1 1 1 19 0 0 1 72 1 1 1 7 4 1 0 1 31 0 1 1 16 1 0 1 61 1 0 ; proc logistic data=logistic descending; model accident=age vision drive; run; proc logistic data=logistic desending; model accident=age vision drive / selection=score ;run; 全模型法 全模型法是指在特定的模型大小范围内,找出指定的最佳模型(具有最小的CP)。通常和BEST连用,如BEST=2,就表示在不同变量个数组成的全模型组中,选择两个最好的模型,显然如果没有best选择,则全部组合数是C(N,2)。度量全模型的统计量是Cp,一般要求CpP,这里p是所有变量的个数加1. Cp=(n-p-1)(MS误差p/MS误差.全部-1)+(p+1)----来源网络,不知道是否可靠 全模型法最大的好处是可以计算每一个变量组合下模型的C统计量以及对应的lift值,这样可以做不同模型直接的比较,缺点是计算量大。调用的SAS命令:selection=score best= start= stop= 。其中start=选项表示最少的变量组合数,默认值是1;stop=选项表示最多的变量组合数,默认值是所有变量数 SELECTION=SCORE叫最优子集法 data logistic1; input accident age vision drive @@; datalines; . 17 1 1 . 44 0 0 . 48 1 0 . 55 0 0 . 75 1 1 . 35 0 1 . 42 1 1 . 57 0 0 . 28 0 1 . 20 0 1 . 38 1 0 . 45 0 1 . 47 1 1 . 52 0 0 . 55 0 1 . 68 1 0 . 18 1 0 . 68 0 0 . 48 1 1 . 17 0 0 . 70 1 1 . 72 1 0 . 35 0 1 . 19 1 0 . 62 1 0 . 39 1 1 . 40 1 1 . 55 0 0 . 68 0 1 . 25 1 0 . 17 0 0 . 4

文档评论(0)

l215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档