应用统计-10第10章-多元线性回归2011年.pptVIP

下载本文档

7
0
约8.7千字
约 70页
2018-05-06 发布于北京
举报
版权申诉

应用统计-10第10章-多元线性回归2011年.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

应用统计-10第10章-多元线性回归2011年.ppt

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 哑变量回归 (例题分析—Excel) Excel输出的结果 * 哑变量回归 (例题分析—SPSS) 哑变量回归 * 哑变量回归 (例题分析—SPSS) 哑变量回归用工作年限和性别预测的月工资水平及其残差 * 哑变量回归 (例题分析—SPSS) 哑变量回归均值图 * 哑变量回归 (例题分析) 引进哑变量时，回归方程写为 E(y) =?0+ ?1x1+ ?2x2 女( x2=0)：E(y|女性) =?0 +?1x1 男(x2=1)：E(y|男性) =(?0 + ?2 ) +?1x1 ?0的含义表示：女性职工的期望月工资收入 (?0+ ?2)的含义表示：男性职工的期望月工资收入 ?1含义表示：工作年限每增加1年，男性或女性工资的平均增加值 ?2含义表示：男性职工的期望月工资收入与女性职工的期望月工资收入之间的差值 (?0+ ?2) - ?0= ?2 * 本章小结多元线性回归模型、回归方程与估计的回归方程回归方程的拟合优度与显著性检验多重共线性问题及其处理利用回归方程进行预测哑变量回归用Excel和SPSS进行回归分析结束 * * * * * * * * * * 12 * * * * * * * * * * * * * * * * 多重共线性(multicollinearity) 回归模型中两个或两个以上的自变量彼此相关多重共线性带来的问题有可能会使回归的结果造成混乱，甚至会把分析引入歧途可能对参数估计值的正负号产生影响，特别是各回归系数的正负号有可能同预期的正负号相反输出结果 * 多重共线性的识别检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数，并对各相关系数进行显著性检验若有一个或多个相关系数显著，就表示模型中所用的自变量之间相关，存在着多重共线性如果出现下列情况，暗示存在多重共线性模型中各对自变量之间显著相关当模型的线性关系检验(F检验)显著时，几乎所有回归系数的t检验却不显著回归系数的正负号与预期的相反输出结果 * 相关矩阵及其检验 (SPSS ) SPSS * 多重共线性的处理将一个或多个相关的自变量从模型中剔除，使保留的自变量尽可能不相关如果要在模型中保留所有的自变量，则应避免根据 t 统计量对单个参数进行检验对因变量值的推断(估计或预测)的限定在自变量样本值的范围内输出结果 10.3.2 变量选择与逐步回归 10.3 多重共线性及其处理 * 变量选择过程在建立回归模型时，对自变量进行筛选选择自变量的原则是对统计量进行显著性检验将一个或一个以上的自变量引入到回归模型中时，是否使得残差平方和(SSE)有显著地减少。如果增加一个自变量使SSE的减少是显著的，则说明有必要将这个自变量引入回归模型，否则，就没有必要将这个自变量引入回归模型确定引入自变量是否使SSE有显著减少的方法，就是使用F统计量的值作为一个标准，以此来确定是在模型中增加一个自变量，还是从模型中剔除一个自变量变量选择的方法主要有：向前选择、向后剔除、逐步回归、最优子集等 * 向前选择 (forward selection) 从模型中没有自变量开始对k个自变量分别拟合对因变量的一元线性回归模型，共有k个，然后找出F统计量的值最高的模型及其自变量(P值最小的)，并将其首先引入模型分别拟合引入模型外的k-1个自变量的二元线性回归模型如此反复进行，直至模型外的自变量均无统计显著性为止 * 向后剔除 (backward elimination) 先对因变量拟合包括所有k个自变量的回归模型。然后考察p(pk)个去掉一个自变量的模型(这些模型中在每一个都有k-1个自变量)，使模型的SSE值减小最少的自变量被挑选出来并从模型中剔除考察p-1个再去掉一个自变量的模型(这些模型中每一个都有k-2个自变量)，使模型的SSE值减小最少的自变量被挑选出来并从模型中剔除如此反复进行，一直将自变量从模型中剔除，直至剔除一个自变量不会使SSE显著减小为止 * 逐步回归 (stepwise regression) 将向前选择和向后剔除两种方法结合起来筛选自变量在增加了一个自变量后，它会对模型中所有的变量进行考察，看看有没有可能剔除某个自变量。如果在增加了一个自变量后，前面增加的某个自变量对模型的贡献变得不显著，这个变量就会被剔除按照方法不停地