多元回归分析的步骤.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
- - 三、研究方法 本文采取多元线性回归的方法来设定并建立模型, 再利用逐步回归来对变量予以确认和剔除。 逐步回归是通过筛选, 挑选偏回归平方和贡献最大的因子建立回归方程,在决定是否引入一个新的因素时, 回归方程要用方差比进行显著性检验。如果判别该影响因子通过显著性检验, 那么可选入方程中, 否则就不应该进入到回归方程,回归方程中剔除一个变量的标准也是用方差比进行显著性检验 剔除偏回归平方和贡献最小的变量, 无论是入选回归方程还是从回归方程中剔除符合条件的选入项和剔除项为止, 逐步回归的方法剔除了对因变量影响小的因素减小了分析问题的难度, 提高了计算效率和回归方程的稳定性有较好的预测精度。运用多元线性回归预测的基本思路是在确定因变量和多个自变量以及它们 之间的关系后,通过设定自变量参数的回归方程对因变量进行预测。具体如下 : Y = C + a1 X 1 + a2 X 2 + + an X n 式中 : Y 表示为粮食总产量, C 和 a 为回归系数, C、a 是待定参数, X 为所选取的影响因素 . 多元线性回归方法可分为强行进入法、消去法、向前选择法、向后剔除法和逐步进入法等,本文运用 SPSS22.0 软件,对选择的自变量全部进入回归模型,即强行进入法进行预测。该模型的优点是方法简单、预测速度快、外推性好等。 四、分析与结果 本文选取 6 个解释变量,研究河南省粮食产量 y,解释变量为 :X1 粮食播种面积, X2 农业从业人, X3 农用机械总动力, X4 农田有效灌溉面积, X5化肥施用 折纯量, X6 农村用电量。以河南省粮食产量为因变量,以如上 6 个解释变量为 自变量做多元线性回归(数据选取 2014 年《河南统计年鉴》,见附录一)。 SPSS做变量的相关分析,从相关矩阵(表 4-1 )中可以看出 y 与自变量的相关系数大多都在 0.9 以上,说明所选择变量与 y 高度线性相关, 用 y 与自变量做多元线性回归是合适的。 4-1 相关 X1 X2 X3 X4 X5 X6 y X1 1 .687 .965 .918 .927 .970 .978 X2 .687 1 .686 .456 .448 .731 .616 X3 .965 .686 1 .946 .930 .990 .985 X4 .918 .456 .946 1 .961 .921 .960 X5 .927 .448 .930 .961 1 .901 .965 X6 .970 .731 .990 .921 .901 1 .979 y .978 .616 .985 .960 .965 .979 1 SPSS做变量系数分析(表 4-2 ) 4-2 系数 B 标准错误 Beta T 显著性 (常数) -6733.268 3146.969 -2.140 .041 X1 8.315 2.765 .262 3.007 .006 X2 .155 .296 .121 .524 .604 X3 -.199 .105 -.607 -1.901 .068 X4 2.619 2.687 .169 .974 .338 X5 5.770 2.492 1.047 2.315 .028 X6 1.086 5.174 .089 .210 .835 从(表 4-2)中可以得到解释变量与因变量之间的方程为: y 6733.268 8.315x1 0.155x2 0.199x3 2.619x4 5.77x5 1.086x6 表 4-3 变异数分析 平方和 df 平均值平方 F 显著性 回归126 6 6785344.021 165.292 .000 残差 1149417.679 28 41050.631 估计805 34 从(表 4-3 )中发现 F=165.292,说明 6 个自变量整体对因变量 y 产生显著 线性影响。但从表 (4-2) 中不难发现农业从业人员、农田有效灌溉面积、农村用 电量的 P 值较大,说明方程某些解释变量并不显著, 对没有通过检验的回归系数, 在一定程度上说明他们对应的自变量在方程中可有可无,一般为了使模型简化, 需要剔除不显著的自变量, 重新建立回归方程。 而且粮食播种面积、 农业从业人 员、农田有效灌溉面积、化肥施用折纯量、农村用电量对国民总收入起正影响, 农用机械总动力却对国民总收入起负影响, 与常识相违背,可能存在多重共线性。 应用 SPSS进行异方差性检验。用斯皮尔曼相关系数检验异方差性也就是检 验随机误差项的方差与解释变量观测值之间的相关性。 若相关系数较高, 则存在 异方差性,则不能通过异方差性检验, 此时可能会导致参数 OLS估计的方差增大, 检验失效,预测精度降低。 表 4-4 相关 Standa

文档评论(0)

明若晓溪 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档