- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据及SPSS软件讲述
第二讲 SPSS中数据统计处理实例及系统运行方式 第三讲 多元线性回归模型及实例 多元线性回归模型:表现在线性回归模型中的解释变量有多个。 一般表现形式: 二、多元线性回归模型的基本假定 假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。 假设2,随机误差项具有零均值、同方差及不序列相关性 一、普通最小二乘估计 对于随机抽取的n组观测值 §3.3 参数估计量的性质 在满足基本假设的情况下,其结构参数?的普通最小二乘估计、最大或然估计及矩估计仍具有: 线性性、无偏性、有效性。 (一)回归方程的显著性检验 (一)拟合优度 (二)回归方程显著性的F检验 (三)回归系数的显著性检验 (四)回归参数的置信区间 回归拟合度评价和决定系数 拟合优度:检验回归方程对样本观测值的拟合程度。 两变量回归决定系数的公式 (二)回归方程显著性的F检验 F统计量 (三)回归系数的显著性检验(t检验) 方程的总体线性关系显著?每个解释变量对被解释变量的影响都是显著的 (四)参数的置信区间 参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 在变量的显著性检验中已经知道: 例 国际旅游外汇收入分析 逐步回归方法的基本思想:对全部的自变量x1,x2,...,xp,按它们对Y贡献的大小进行比较,并通过F检验法,选择偏回归平方和显著的变量进入回归方程,每一步只引入一个变量,同时建立一个偏回归方程。当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和。如果由于引入新的变量而使得已进入方程的变量变为不显著时,则及时从偏回归方程中剔除。在引入了两个自变量以后,便开始考虑是否有需要剔除的变量。只有当回归方程中的所有自变量对Y都有显著影响而不需要剔除时,在考虑从未选入方程的自变量中,挑选对Y有显著影响的新的变量进入方程。不论引入还是剔除一个变量都称为一步。不断重复这一过程,直至无法剔除已引入的变量,也无法再引入新的自变量时,逐步回归过程结束。 当有些解释变量很重要,不能舍弃时,可以利用1933年Hotelling提出的主成分分析法(又称主分量分析或主轴分析),用较少的“综合变量”来代替原来较多有多重共线性的变量,用新变量进行回归分析,再回代为原变量的回归模型。 主成分估计是以P个主成分中的前q个贡献大的主成分为自变量建立回归方程,估计参数的一种方法。 它可以消除变量间的多重共线性。 回归方程 对各变量进行标准化处理 对于解释变量X*,使得z=X*U SPSS实现主成分回归 1、对所有变量进行标准化(Descriptives ) 2、对所有标准化后的自变量求主成分Z(Analyse-Reduction (factor))3、选择前几个主成分(85%) 4、由因子载荷矩阵以及特征值计算主成分系数矩阵,通过transform-Compute过程计算主成分得分C。 C=UX*/λi(也可选score(回归)得到) 5、?用标准化的因变量和主成分进行OLS回归(analyse-regression),求出α系数值。 6、通过Compute过程手工计算 , 对回归方程参数重组,转化为原因变量和自变量的表达式。 即可得出消除多重共线性的标准回归方程。 例3.9 经济工作者希望通过国内总产值x1,存储量x2,消费总量x3,去预测进口总额y,为此收集了某地区共计十一年的有关数据,利用主成分估计建立回归方程。(数据略) Z1=0.7066*zx1+0.0435*zx2+0.7066*zx3 Z2=-0.0357*zx1+0.9990*zx2-0.0258*zx3 例3.10 影响电的需求量的指标有:(1)钢的产量x1;(2)生铁产量x2;(3)钢材产量x3;(4)有色金属产量x4;(5)原煤产量x5;(6)水泥产量x6;(7)机械工业总产值x7;(8)化肥产量x8;(9)硫酸产量x9;(10)烧碱产量x10;(11)棉纱产量x11共11个指标。收集了23年的指标值,建立发电站需求模型。(数据略) Z1=0.3145*zx1+0.3027*zx2+0.3100*zx3+0.2782*zx4+0.2518*zx5+0.3110*zx6+0.3116*zx7+0.3075*zx8+0.3034*zx9+0.3145*zx10+0.3050*zx11 Z2=-0.0522*zx1+0.2949*zx2-0.0469*zx3+0.3696*zx4+0.7199*zx5-0.1919*zx6-0.1391*zx7-0.2421*zx8-0.3361*z
文档评论(0)