商务统计第四章01变量的回归模型Logistic回归Probit回归王汉生重点剖析.pptVIP

商务统计第四章01变量的回归模型Logistic回归Probit回归王汉生重点剖析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Best Logit Model (AIC) Best Logit Model (BIC) Best Probit Model (AIC) Best Probit Model (BIC) Form a Prediction Rule Whenever P(ST=1|X)0.50, we predict future observation ST=1. Is 0.50 the only choice? The prediction accuracy Take logit full model as an example The overall misclassification rate = 6.3% Question: is this good? 显著性检验 构造检验统计量: 只要样本容量足够大,我们就可以计算这一检验的P值 如果是多变量情况,可以使用似然比检验 似然比检验 在原假设 下, LR 近似服从自由度为DF的卡方分布, 而 DF 是包含在 中的变量个数。 多变量逻辑回归 多变量逻辑模型 将所有影响因素带入模型,得到如下方程: 广义线性回归语句glm 先介绍一下R中的广义线性回归语句glm 语法为:glm(formula, family = gaussian, data, weights, subset, na.action, start = NULL, etastart, mustart, offset, control = glm.control(...), model = TRUE, method = glm.fit, x = FALSE, y = TRUE, contrasts = NULL, ...) 与lm不同之处就在于参数family 这个参数的作用在于定义一个族以及连接函数,使用该连接函数将因变量的期望与自变量联系起来 下页语句中的family= binomial(link=logit)表示引用了二项分布族binomial中的logit连接函数 logit模型整体显著性的检验 比较下面两个模型:空模型和全模型,对其进行方差分析: probit模型整体显著性的检验 参数估计:Logistic 参数估计:Probit 参数估计 从变量的显著性检验中可以得到如下结论: 应收账款与总资产比例(ARA)和被ST与否高度相关,且其值越高,被ST可能性越大; 债务资产比率(LEV)和被ST与否高度相关,且其值越高,被ST可能性越大; 在probit模型中,销售收入增长率(GROWTH)和被ST与否高度相关,其值越低,被ST可能性越大。 没有证据表明其他因素对ST与否有显著影响。 变量选择:logit 剔除掉不显著的变量,得到: 变量选择:probit 剔除掉不显著的变量,得到: 模型的选择 模型的选择 对比线性模型下的AIC和BIC函数: 使用step函数自动选择:logit 使用step函数自动选择:logit 使用step函数自动选择:probit 使用step函数自动选择:probit 预测与评估 未来被ST的概率为: logit模型: probit模型: 前面估计出的参数: 将某样本值代入得: 该公司被ST的概率为: 使用该模型对a2中所有数据预测 从该表中可以看出,共有699+47个样本,其中699个成功被预测成为ST=0,47个被错误的预测成为ST=0。所以预测精度达到93.7%。但是注意,所有的预测值都为0,也就是说没有预测出任何一家公司被ST,显然这不是我们需要的。 定义两种不同的分类错误P(ST=1|X)0.4 True Response 0 1 Predict- ion 0 697 46 1 2 1 False Positive Rate(FPR) = 2/(697+2)=0.29% True Positive Rate(TPR) = 1/(46+1)=2.12% 定义两种不同的分类错误 P(ST=1|X)0.3 True Response 0 1 Predict- ion 0 692 45 1 7 2 False Positive Rate = 7/(692+7)=1.00% True Positive Rate = 2/(45+2)=4.25% 定义两种不同的分类错误P(ST=1|X)0.1 True Response 0 1 Predict- ion 0 655 36 1 44 11 False Positive Rate = 44/(655+44)=6.29% True Positive Rate = 11/(36+11)=23.40% 回头看我们的数据: 训练样本: Year = 1999 (ST 时间 = 2002) 样本容

文档评论(0)

w5544434 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档