网站大量收购独家精品文档,联系QQ:2885784924

第十二章 回归分析(二).ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章 回归分析(二)

第十二章 回归分析(二) 分类资料的回归分析 二项逻辑回归 多维逻辑回归 序数回归 概率回归分析 12.1 二项逻辑回归 12.1 二项逻辑回归 12.1 二项逻辑回归 12.1 二项逻辑回归 12.1 二项逻辑回归 12.1 二项逻辑回归 12.1 二项逻辑回归 12.1 二项逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.2 多维逻辑回归 12.3 序数回归 12.3 序数回归 12.3 序数回归 12.3 序数回归 12.3 序数回归 12.4 概率回归 12.4 概率回归 12.4 概率回归 12.4 概率回归 12.4 概率回归 12.4 概率回归 12.4 概率回归 课件制作:重庆工商大学统计学系 叶勇 课件制作:重庆工商大学统计学系 叶勇 前面研究过虚拟变量回归,即自变量取值为0,1,有些情况因变量是一个虚拟变量,其取值为合格/不合格、是/否等情况,这种情况我们可以用logistic模型进行研究。 12.1.1 模型简介 设P为某事件发生的概率,取值范围为0~1,1-P为事件不发生的概率,将比值 P/(1-P)取自然对数得到 ln(P/(1-P)),该变换称为Logit变换,记为Logit P,则Logit P的取值范围为负无穷到正无穷,建立线性回归模型 Logit P = a + b1X1 + … +bmXm P= exp(a + b1X1 + … +bmXm) /(1+exp(a + b1X1 + … +bmXm)) 最常用的是一元和二元模型。 ☆对于下面的叙述暂时弄不清楚不要紧,只要知道回归模型的应用即可,即回归模型最后得到因变量Y=1的概率P。 Logistic模型实际上是普通多元线性回归模型的推广,但其误差项服从二项分布而非正态分布,估计时一般采用最大似然法进行参数估计。 模型中参数a为常数项,表示自变量全为0时比值(Y=1和Y=0的概率比)的自然对数值,参数βi称为Logistic回归系数,表示其他自变量不变时,该自变量取值增加一个单位引起 概率比(OR)的自然对数值的变化量。 Logistic回归模型对样本量有严格的要求,一般经验是选择因变量中取值(0,1)中较少的一类,然后将其除以10,得到模型中可以采用的自变量的个数。如有100位同学,其中合格的70,不合格的30,则模型中最多可以引入的自变量为30/10=3,如果要进行四元回归,则需要增加样本量。 例:一位教授在课程《中级宏观经济学》中引入一种新教学法PSI(个性化授课),在效果评价中,得到如下资料。 GAP:修该门课程前的学分绩点 PSI: =1 使用PSI授课法 =0 不使用PSI法 TUCH:修该门课程前的摸底成绩 LG(Y):该门课程的考试成绩 LG=1 成绩为A LG=0 成绩为B或C 数据见 PSI授课法效果评价.sav 该案例因变量属于二项分类变量,其误差项服从Logistic分布,故可采用二项逻辑回归。 1.Analyze?Regression?Binary Logistic 2.以LG为因变量,变量GAP、PSI和TUCH为协变量,回归方法选Enter。 结论分析: 1.因变量编码 2.Block 0: Beginning Block 初始模型,只有常数项,仅作参考 常数模型的预测效果不太理想,由分类表格知所有人的成绩都预测为0(B或C)。 结论分析: 3.Block 1: Method=Enter a.由模型系数检验知,模型的卡方值较大,P=0.002,模型整体显著 b.模型拟合情况看,两个R2值均不大,说明模型拟合情况不大好。 c.预测情况 结论分析: 变量的显著性检验: GAP(之前的总成绩)和PSI(教学法)对该课程最后的成绩影响显著,而该课程的摸底成绩TUCH影响不显著。 判断标准仍然是P值。 练习题: 现有16家公司的财务比率数据,其中7家公司两年后破产,9家公司运营正常。选择的财务比率有净收入与总资产的比率x1和流动资产与销售额的比率x2,因变量y取值1表示破产,试建立预测模型。 数据见 企业破产资料.sav 某信贷经理对公司贷款的拖欠情况进行分析。对于每一笔贷款,均有贷款人的个人年收入和财产(单位均为千美元)及工作时间时间,请建立贷款的拖欠预测模型。 如果一申请者年收入为4万美元,财产为10万美元,工作时间为11年,预测该申请者是否会拖欠贷款。 如果因变量不是两个分类,而是多个分类,使用二项逻辑回归显然不能满足要求。 对于这种模型,一般通过一种叫广义Logit模型的

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档