- 31
- 0
- 约 8页
- 2017-05-07 发布于湖北
- 举报
多元线性回归模型及其应用
摘要
多元线性回归研究一个因变量、与两个或两个以上自变量的回归,是反映一种现象或事物的数量依多种现象或事物的数量的变动而相应地变动的规律。建立多个变量之间线性或非线性数学模型数量关系式的统计方法。多元线性回归模型主要分为建模、基本假设、检验、预测等。检验是建立模型的核心,包括拟合检验、F检验、T检验。本文采用2005-2006年全国财政支出数据和2005年全国各地生产总值数据,建立多元线性回归模型,预测2006年全国各地生产总值,并与实际数据分析比较。建模使用了SPSS和MATLAB软件。
1.引言
在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。在实际经济问题中,一个变量往往受到多个变量的影响。因此本文运用多元线性回归模型分析2005年全国各地财政支出对生产总值的影响,并对2006年生产总值进行预测,将预测值与实际数据进行比较,从而体现多元线性回归模型预测的准确性。
2.模型建立
2.1准备数据
本文选取2005年我国31个省、市、自治区的地区生产总值和13个重要支出项,分别是:为基本建设支出,为企业挖潜改造资金,为科技三项费用,为农业支出,为农林水利气象等部门事业费,为工业交通部门事业费,为流动部门事业费,为教育事业费,为科学事业费,为卫生经费,为行政管理费,为公检法司支出,为城市维护费。为地区生产总值。(数据单位为:万元)
2.2建模
将13个重要支出项设为自变量,用表示;将地区生产总值设为因变量。采用最小二乘法拟合一个多元线性回归模型,采用数学软件SRSS计算出回归系数,运行结果如下表:
模型非标准化系数标准系数tSig.标准误差试用版1(常量)-4182809.8925604506.176-0.7460.466-25.77010.031-0.330-2.5690.02026.68117.3270.2081.5400.142-6.03261.820-0.012-0.0980.923-95.59853.292-0.281-1.7940.091-43.76787.974-0.077-0.4980.62511.59074.3190.0140.1560.878-188.668272.581-0.044-0.6920.49850.63914.0420.6823.6060.002-62.117187.183-0.050-0.3320.744-81.36043.526-0.300-1.8690.07946.11123.1950.4171.9880.06355.69639.1620.4561.4220.17340.95314.6480.2722.7960.012表2.1
因而对13个自变量的线性回归方程为:
(2.1)
2.3模型检验
首先,对模型(2.1)进行拟合优度的检验,采用数学软件SRSS计算样本可决系数和调整后的样本可决系数,运行结果如下表
模型标准估计的误差10.992a0.9850.9738933132.933表2.2 模型汇总
由表2.2可知,模型(2.1)拟合效果很好。
然后,对模型(2.1)进行显著性F检验,提出原假设:采用数学软件SRSS计算出的方差分析表如下表
模型平方和df均方FSig.1回归8.780E16136.754E1584.6340.000a残差1.357E15177.980E13总计8.916E1630表2.3 方差分析表
表2.3中的Sig.即为显著性P值,由P值=0.000(近似值),,P值小于,所以,拒绝原假设,认为在显著性水平的条件下,因变量对自变量有显著的线性关系,即回归方程(2.1)是显著的。
最后,对模型(2.1)进行回归系数的显著性检验,提出原假设其中 。利用SPSS计算出关于的t统计量及相应的P值,见表2.1。由表我们可以发现并不是所有的单独对因变量都有显著影响。这说明尽管回归方程通过了显著性检验,但也会出现某些单个变量对并不显著的情况。
由于某些变量不显著,因此本文采取后退法[3]简单的剔除多余变量,由于变量间的交互作用,不能一次性剔除所有不显著的变量,所以进行依次剔除,首先剔除P值最大的一个变量,然后再进回归系数的显
原创力文档

文档评论(0)