Logistic回归综述.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算中心 Logistic回归分析 对于用属性变量Y表示的特性,例如节目是否受欢迎,产品是否被接受,信用卡是否被欺诈等,描述这一特性发生与否的统计特征是它发生的可能性大小,即概率。这一可能性本身也受其他因素的影响。因而也希望用一些自变量来说明和预测所关心的特性发生的可能性大小。 当Y是连续变量时,可用方差分析和回归分析处理;当Y时属性变量时,则用Logistic回归分析处理。 计算中心 Logistic回归分析 拟合Logistic回归模型不采用通常的最小二乘法,而是采用最大似然法。对于拟合的结果,检验模型或参数的显著性,也不是使用线性模型中的方差分析方法,而是使用与最大似然估计法相联系的卡方(?2)统计量进行检验。原假设是模型无显著影响或回归系数全为零。 计算中心 Logistic回归分析 描述属性变量Y所表示的某一特征发生的可能性大小(即概率p),也希望用一些自变量x1, x2,...来说明和预测。特别是两值问题(Y=0表示某事件A不发生,Y=1表示发生):记 P{Y=1}=p p的取值在0与1之间变化,所以简单地将概率p表示为自变量x1, x2,....的线性函数是不合适的。 计算中心 Logistic回归分析 概率p作一变换f(p) 假设在自变量x1,x2,…xn作用下,某事件发生的概率为p,则该事件不发生的概率为1-p,p/(1-p)为发生概率和不发生概率之比,称为“优势比”(odds),若对odds取自然对数,得到: Logistic回归模型: Logit(p)=ln(p/(1-p))=β0+β1x1+β2x2+βnxn Y=Logit(p) 的图形如下 (随p由0变到1,Y的值由-∞单调上升到∞) 计算中心 Logistic回归分析 计算中心 Logistic回归分析 上模型称为Logistic回归模型.其中最简单的情况是只含一个自变量: logit(p)=β0+β1x 或 计算中心 Logistic回归分析 一般地,拟合回归模型时,是要建立属性变量(因变量)取某种状态的概率pi关于自变量的关系式.自变量若也是属性的变量,应先把它数量化.比如自变量x取k种不同的状态,引入k-1个标识变量zi(i=1,...,k-1)作为自变量.其中 zi = 1 , 当x取第i种状态, zi = 0 , 其它. (i =1,…,k-1). 例 下表记录了某公司在过去6个月中的顾客信息.其中包括顾客的性别(gender:0=男和1=女),顾客的年龄(AGE),顾客的年收入(income:1=低,2=中和3=高)和购买价值(PURCHASE:0=小于100元,1=大于等于100元),共记录了431位顾客的资料,数据集为sales1。 计算中心 用分析家作logistic分析 统计→回归→ Logistic...。 purchase → Dependent, sex→ Quantitative 在Logistic回归分析主窗口Dependent左边点击Model Pr{ }右侧向下箭头 ,并且选1; 在主窗口选Statistics键 →Intervals,并选中Profile Likelihood Limits(使它左边方框打勾). 计算中心 结果分析 数据集名称:sales1 目标变量:purchase 目标变量类别数:2 映射函数:logit 观测值:431 计算中心 结果分析 收敛状态(Model Convergence Status 指参数估计是否收敛 模型拟合统计量(Model Fit Statistics) 类似于线性回归中的总平方和、残差平方和等,在logit回归中较少关注 计算中心 结果分析 总体拟合测试(Test Global Null Hypothesis) 测试有预测变量和没有预测变量效果是否一样 原假设:效果一样,如果P很小,效果不一样 Likelihood Ratio:似然比卡方值 4.6978=570.649-565.951 其对应的P值小,建模效果显著 计算中心 结果分析 参数估计值 (Analysis of Maxamum Likelihood Estimates) 回归方程: Logit(p)=-0.7566+0.4373*sex 由检验的显著性概率值(分别为0.001和0.0312)可知在0.05的水平下回归式的两个系数均显著地不为0. 计算中心 结果分析 优势比估计(Odds Ratio Estimat

文档评论(0)

我是追梦人 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档