CH人大埃文斯数据模型与决策多元回归分析改编版.docxVIP

CH人大埃文斯数据模型与决策多元回归分析改编版.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
: 章 回归分析 Part 2: 6.4 多元线性回归 Multiple Linear Regression 模型形式Model Form 多元线性回归模型: Y = ?? ???? X1 ???? X2 + ... + ?k Xk + ? 预测模型: Y = b0 + b1X1 + b2 X2 + ... + bk Xk 各解释变量的系数b被称为偏回归系数 例题: Colleges and Universities Data学院和大学数据 6.4.1 多元线性回归结果的解释 多元回归统计量含义与一元回归类似 R 平方R Square (coefficient of multiple determination可决系数) R2=0.534 表示大约 53% 毕业率变动能够被方程中的4各解释变量(自变量)所解释。 调整的R2 (Adjusted R2) 是对样本量和解释变量个数调整后的结果,在多元回归中更具有参考价值。 若建模目的在于验证哪些自变量对因变量具有显著影响,则R2 不必要求是一个较大数值。 方差分析结果ANOVA Results 回归方程的显著性Significance of regression H0: ?1 = ?2 =… = ?k = 0 注:F对应的P值(Significance F) 0.05表明回归方程显著。H:至少一个?不为0小于 ? 1 j 残差图举例Example Residual Plot 个别解释变量系数的检验Test for Individual Coefficients H0: ?j = 0 vs. H1: ?j ? 0 若输出表中某个解释变量系数t检验统计量(t Stat)后的P值 (P-value)小于0.05,表明该解释变量对被解释变量具有显著影响,否则该变量不显著。 H0: ?1 = 0 vs. H1: ?1 ? 0 Copyright ? 2010 Pearson Education, Inc. Publishing as Prentice Hall 6(2)-8 6.4.2 多重共线性Multicollinearity 多重共线性 – 两个或更多的解释变量包含较高的相同信息,即解释变量的信息重复。 多重共线性的存在使得对回归系数的解释存在困难。 多重共线性的一般表现:①部分自变量之间显著相关;②回归方程(F检验)显著,而几乎所有回归系数b的t检验却不显著;③回归系数的正负号与预期相反。 解释变量相关系数矩阵Correlation Matrix 上表显示存在潜在的多重共线性问题。然而对多重共线性更为精确的测度需要计算方差膨胀因子variance inflation factors (VIFs). 度量多重共线性Measuring Multicollinearity 1 ? 方差膨胀因子,VIF = 2 1 ? r j 如果不存在多重共线性,则 VIF = 1 一般来说,如果方差膨胀因子 VIF 不超过5,表明不存在多重共线性问题。 方差膨胀因子计算结果VIF Results 6.5 回归模型的构建方法Modeling Approach 构建一个包含所有自变量的模型。通过P值(p-values)来检验自变量的显著性。 识别具有最大P值且超过了所选定显著性水平的自变量。 把不显著的自变量从模型中剔除,计算调整后的 R2 (adjusted R2)。 重复上述步骤,直到剩下的所有变量都具有统计上的显著性。 备注:如果建模的目的不是为了预测等,而是检验某些自变量是否对因变量具有显著影响,则不必进行上述操作, 只需进行显著性检验并加以解释即可。 例题: 银行数据文件Banking Data File 回归结果Regression Results ANOVA Sum of Mean Model Squares df Square F Sig. 1 Regression 7.24E+09 5 1.45E+09 342.439 .000a Residual 4.06E+08 96 4225669 Total 7.64E+09 101 Copyright ? 2010 Pearson Education, Inc. Publishing as Prentice Hall 6(2)-15 Income和Wealth变量的方差膨胀因子VIF大于5,表明回归方程存在多重共线性问题。 Coefficients Standar dized Unstandardized Coefficie Collinearity Coefficients nts Statistics Tolera Model B Std. Error Beta t Sig. nce VIF 1 (Constant) -10710

文档评论(0)

170****0236 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档