第7章回归解说.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7.4.3 Logistic回归模型系数的解释 (4) 第二步,计算Wald统计量 Wald统计量定义为 其中,为的标准误差。这个单变量Wald统计量服从自由度为1的分布。 第三步,做出统计决策 计算各自变量的Wald的观测值和对应的概率p值。 如果对于某自变量,计算出的p值小于给定的显著性水平α,则拒绝零假设,认为该自变量与之间的关系显著,应该保留在回归方程中; 如果p值大于等于给定的显著性水平α ,则接受零假设,认为该自变量与之间的关系不显著,不应该保留在回归方程中。 7.4.3 Logistic回归模型系数的解释 (5) 如果需要检验假设, 计算统计量 其中, 为去掉的估计值,相应地, 为去掉 的标准误差。这里,Wald统计量服从自由度等于k的 分布。 7.4.4 显著性检验 (1) (2)线性关系的显著性检验 Logistic回归方程线性关系的显著性检验的目的是检验全体自变量与的线性关系是否显著。 由于Logistic回归方程求解参数是采用最大似然估计方法,因此对回归方程的显著性也通过似然函数来判断。似然函数值是在假设拟合模型成立的条件下能够观测到这一特定样本的概率。最大似然函数值L是一个在[0,1]之间很小的数,对L取对数后得到的必然小于0。所以,通常将L取对数后再乘以-2,越大意味着回归模型的似然值越小,模型的拟合程度越差;越小意味着回归模型的似然值越大,似然值越接近于1,模型的拟合程度越好;如果似然值等于1,则表示模型完全拟合了观测值。 7.4.4 显著性检验 (2) 在检验Logistic回归模型时,通常将回归模型与截距模型相比较。所谓截距模型是指如下形式的模型:该模型没有引入任何自变量,它的似然值最小,是一个“不好”的模型。以截距模型作为“基准”,比较当模型中引入了自变量后新的模型与数据的拟合水平是否差别显著。差别越大,说明新的模型越有效。 7.4.4 显著性检验 (3) 线性关系的显著性检验步骤如下: 第一步:定义截距模型,用表示截距模型的似然值。 第二步:对于所要检验的模型,其包含若干个自变量,其似然值为L。 第三步:构造对数似然比(Likelihood ratio test)统计量:近似服从 分布,其自由度为检验回归模型的自变量个数k。 第四步:提出假设: 第五步:给出显著性水平 。计算统计量 和对应的p值。如果(即p大于等于显著性水平α),则接受零假设,认为目前方程中的所有回归系数同时为零,自变量全体与之间的线性关系不显著;如果(即p小于显著性水平 ),则拒绝零假设,认为目前方程中的所有回归系数不同时为零,自变量全体与之间的线性关系显著; */28 7.4.5 回归方程的拟合优度检验 (1) 拟合优度表示回归方程能够解释因变量的变差程度。如果方程可以解释因变量的较大部分变差,则说明拟合优度高,反之则说明拟合优度低。另外也可以从回归方程的预测准确度来衡量拟合优度。Logistic回归方程的拟合优度常用的有以下几种。 (1) 基于Cox Snell R2统计量的优度检验 Cox Snell R2与一般线性回归的R2有相似之处,也是方程对因变量变差解释程度的反映,其定义为: 其中是只包含常数项时的似然函数值,L是当前方程的似然函数值,n为样本量。 Cox Snell R2的取值范围不易确定,解释时有一定困难。 7.4.5 回归方程的拟合优度检验 (2) (2) 基于Nagelkerke R2统计量的优度检验 Nagelkerke R2是修正的Cox Snell R2,也反映方程对因变量变差解释的程度,定义为: Nagelkerke R2的取值在0~1之间,越接近1,说明方程的拟合优度越高,越接近于0,说明方程的拟合优度越低。例子 例7.4 房地产商希望能建立签订意向的顾客最终真正买房的概率与家庭年收入间的关系式,以便能分析家庭年收入的不同对最终购买住房的影响。 7.5 小结社会经济领域与自然科学领域中的诸多现象之间存在着相互联系和相互制约的普遍规律,回归分析法就是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系表达式,以描述这些联系与制约的相关关系。回归分析是进行定量分析、统计预测的一种重要手段,它依据事物内部因素变化的因果关系来预测事物未来的发展趋势,在社会经济各领域有着广泛的应用。 本章重点对线性回归、特殊的非线性回归以及二元逻辑回归做了基本的介绍,其中线性回归的目标属性是数值型的,用于预测目标属性的取值;而逻辑回归的目标属性是分类型的,用于对目标属性的分类。并通过实例说明回归分析方法的应用。 作业,P142: 7.2,7.3,7.7,7.8 */39 * */39 * 商务数据挖掘与应用案例分析 第7

文档评论(0)

yy556911 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档