商务统计第四章01变量的回归模型Logistic回归Probit回归王汉生重点剖析.pptVIP

下载本文档

29
0
约4.82千字
约 64页
2017-05-15 发布于湖北
举报
版权申诉

商务统计第四章01变量的回归模型Logistic回归Probit回归王汉生重点剖析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Best Logit Model (AIC) Best Logit Model (BIC) Best Probit Model (AIC) Best Probit Model (BIC) Form a Prediction Rule Whenever P(ST=1|X)0.50, we predict future observation ST=1. Is 0.50 the only choice? The prediction accuracy Take logit full model as an example The overall misclassification rate = 6.3% Question: is this good? 显著性检验构造检验统计量：只要样本容量足够大，我们就可以计算这一检验的P值如果是多变量情况，可以使用似然比检验似然比检验在原假设下, LR 近似服从自由度为DF的卡方分布, 而 DF 是包含在中的变量个数。多变量逻辑回归多变量逻辑模型将所有影响因素带入模型，得到如下方程：广义线性回归语句glm 先介绍一下R中的广义线性回归语句glm 语法为：glm(formula, family = gaussian, data, weights, subset, na.action, start = NULL, etastart, mustart, offset, control = glm.control(...), model = TRUE, method = glm.fit, x = FALSE, y = TRUE, contrasts = NULL, ...) 与lm不同之处就在于参数family 这个参数的作用在于定义一个族以及连接函数，使用该连接函数将因变量的期望与自变量联系起来下页语句中的family= binomial(link=logit)表示引用了二项分布族binomial中的logit连接函数 logit模型整体显著性的检验比较下面两个模型：空模型和全模型，对其进行方差分析： probit模型整体显著性的检验参数估计：Logistic 参数估计：Probit 参数估计从变量的显著性检验中可以得到如下结论：应收账款与总资产比例（ARA）和被ST与否高度相关，且其值越高，被ST可能性越大；债务资产比率（LEV）和被ST与否高度相关，且其值越高，被ST可能性越大；在probit模型中，销售收入增长率（GROWTH）和被ST与否高度相关，其值越低，被ST可能性越大。没有证据表明其他因素对ST与否有显著影响。变量选择：logit 剔除掉不显著的变量，得到：变量选择：probit 剔除掉不显著的变量，得到：模型的选择模型的选择对比线性模型下的AIC和BIC函数：使用step函数自动选择：logit 使用step函数自动选择：logit 使用step函数自动选择：probit 使用step函数自动选择：probit 预测与评估未来被ST的概率为： logit模型： probit模型：前面估计出的参数：将某样本值代入得：该公司被ST的概率为：使用该模型对a2中所有数据预测从该表中可以看出，共有699+47个样本，其中699个成功被预测成为ST=0，47个被错误的预测成为ST=0。所以预测精度达到93.7%。但是注意，所有的预测值都为0，也就是说没有预测出任何一家公司被ST，显然这不是我们需要的。定义两种不同的分类错误P(ST=1|X)0.4 True Response 0 1 Predict- ion 0 697 46 1 2 1 False Positive Rate（FPR） = 2/(697+2)=0.29% True Positive Rate（TPR） = 1/(46+1)=2.12% 定义两种不同的分类错误P(ST=1|X)0.3 True Response 0 1 Predict- ion 0 692 45 1 7 2 False Positive Rate = 7/(692+7)=1.00% True Positive Rate = 2/(45+2)=4.25% 定义两种不同的分类错误P(ST=1|X)0.1 True Response 0 1 Predict- ion 0 655 36 1 44 11 False Positive Rate = 44/(655+44)=6.29% True Positive Rate = 11/(36+11)=23.40% 回头看我们的数据：训练样本: Year = 1999 (ST 时间 = 2002) 样本容