- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第11章逻辑回归*第11章逻辑回归分析——目录11.1逻辑回归模型11.2估计逻辑回归模型11.3显著性检验11.4回归系数的含义11.5案例分析*许多社会科学问题中的因变量往往是分类变量。比如,政治学中经常研究的是否选举某候选人,候选人的类型等;又如,经济学研究中所涉及的是否销售或购买某种商品、是否签订一份合同,保险是否违约,违约有哪些类型等等。这些分类变量中有一类特殊的变量,遵循二值取值原则,要么“是”或“发生”,要么“否”或“未发生”。统计上我们将这样的变量称作二分类变量(Binaryvariable)。*应用背景多元回归模型分析二分类变量的局限性被解释变量的取值区间受限制自变量的边际分析不符合实际分析二分类变量的方法利用概率转化模型调整二分类变量使其线性化,也即,使其随着自变量的变化,这一概率的值总是在0到1之间变化。11.1逻辑回归模型Logistic函数Logistic回归方程11.1逻辑回归模型——概率转换方法似然函数其中,11.2估计逻辑回归模型——最大似然估计追求似然函数最大值的过程就是追求对数似然函数值最大值的过程。对数似然函数值越大,意味着模型较好地拟合样本数据的可能性也越大,所得模型的拟合优度越高。整体模型的检验和评价11.3显著性检验整体模型的检验和评价11.3显著性检验判错矩阵预测值01正确率观测值01总体正确率判错矩阵是一种极为直观的评价模型优劣的方法,它通过矩阵表格的形式展现预测值与实际观测值的吻合程度。整体模型的检验和评价11.3显著性检验CoxSnellR2统计量CoxSnellR2统计量与一般线性回归分析中的R2有相似之处,也是方程对被解释变量变差解释程度的反映。缺点是取值范围不易确定,因此使用时不方便。NagelkerkeR2统计量CoxSnellR2统计量取值在0~1之间,越接近1说明方程的拟合优度越高。回归系数的显著性检验11.3显著性检验Wald统计量多重共线性检验应当注意,如果解释变量存在多重共线性会对Wald检验统计量产生影响。由于用于logistic回归建模的很多软件包,如Excel,SPSS,和R并不提供共线性的问题检验,所以如果用户想检验共线性问题,可以就给定的自变量做一个线性回归模型,并输出共线性诊断指标,就可以了解自变量的相关情况。11.4逻辑回归系数的意义平均个人偏效应和平均偏效应Logistic回归模型的解释涉及到对建立回归方程所包含的自变量的分析。也即,我们常常想估计xi对响应概率P(y=1|X)的影响。若xi是(大致)连续的,则对xi的较小变化,有:比例因子11.4逻辑回归系数的意义平均个人偏效应和平均偏效应平均个人偏效应表示将每个解释变量都代之以样本平均值而得到常数比例因子,利用该常数比例因子乘以对应的xi的系数βi即得到平均个人偏效应。数学表达式为:平均个人偏效应(PEA)平均偏效应表示将样本中所有个体的偏效应取平均而得到常数比例因子。数学表达式为:平均偏效应(PEA)11.4逻辑回归系数的意义根据平均个人偏效应的定义,将年龄的样本均值40.00代入公式可计算年龄对购买该产品响应概率影响的平均个人偏效应PEA;将根据个人偏效应的定义,将年龄的样本所有取值代入公式可得年龄对购买该产品响应概率影响的个人偏效应APE。由于logistic模型中,自变量与响应概率之间的关系是非线性的,因此平均个人偏效应和平均偏效应存在差异。11.4逻辑回归系数的意义发生比Logistic回归模型的解释涉及到对建立回归方程所包含的自变量的分析。利用logistic回归,直接解释自变量和y=1的概率之间的关系非常困难,统计学上,通过定义发生比和比值比对logistic回归方程做出解释。发生比发生比被定义为事件将要发生的概率与该事件将不会发生的概率之比。11.4逻辑回归系数的意义比值比比值比(Oddsratio)度量了当一组自变量中只有一个自变量增加了一个单位时对事件发生概率(Odds)的影响。比值比是当给定的一组自变量中一个自变量增加了一个单位,y=1发生概率(Odds1)除以该组自变量的值都没有变化时y=1发生概率(Odds0)比值比(Oddsratio)11.4逻辑回归系数的意义此时,我们想要知道去年消费支出为2万元,且拥有信用卡的顾客使用优惠券的机会比与去年消费支出为2万元,但没
文档评论(0)