2自变量的选择课件.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
由于把估计过程分作两步,从而避免了多重共线性问题。显然这种估计方法默认了一种假设,即相对于时间序列数据各个时期截面数据所对应的收入弹性系数估计值都与第一步求到的 相同。当这种假设不成立时,这种估计方法会带来估计误差。 解决共线性方法 4.从数据上思考引出的板块数据法、增加样本容量法和剔除影响点法 板块数据法就是把截面数据与时序数据结合起来的方法。 采用这种方法隐含着一个假定,即从截面数据中估计的参数与从时序数据中估计的参数是相等的,因此它仅适用于从一个截面到另一个截面数据、估计值相对稳定的情况。 剔除多重共线性的影响点法是指经过诊断后假定样本点为影响点,从原样本中剔除第i个样本点,可以减轻共线性程度。 这种方法的问题是诊断出的这个样本点是否应该剔除,这里需特别指出的是,当没有真正弄清楚样本点形成机制之前,不能轻易剔除,因为影响点的形成可能是随机因素,也可能是经济机制变化,当后者发生时,无论影响点的剔除对减轻多重共线性的作用有多大,也不能剔除。 解决共线性方法 5.从估计方法上思考引出的估计量 如有偏估计 所谓有偏估计法是指参数估计量是有偏的,但估计量的均方误差比采取OLS法估计的无偏估计量的均方误差小,即以偏误为代价来提高估计量的准确性。 主成分回归分析 1993年由Hotelling提出了主成分分析的方法,之后W.F.Massy于1965年根据主成分分析的思想提出了主成分回归。如今主成分回归方法已经被广泛采用,成为回归分析中较有影响的估计方法。 主成分分析的核心思想就是通过降维,把多个指标化为少数几个综合指标,而尽量不改变指标体系对因变量的解释程度。 主成分的提取分5个步骤: 1、为了使结果不受量纲的影响,先把原始数据进行标准化。 2、求出标准化数据的相关系数矩阵、协方差。 3、导出相关系数矩阵的特征值和特征向量。 4、最大的特征值对应的特征向量即为第一主成分的系数,第二大的特征值对应的特征向量即为第二主成分的系数,以此类推。取几个主成分取决于主成分对因变量的解释程度。如果前i个特征值之和与所有特征值之和的比达到一定的程度比如80%时,就可以认为这些主成分就能代替所有的自变量体系。 5、用主成分对因变量进行普通最小二乘法即可得出各个主成分对因变量的解释程度。 可以看出,主成分回归分析解决多重共线性问题是通过求特征值和特征向量达到降维来实现的,因为在降维前,指标之间的多重共线性可能是由于某个指标或者少数指标所包含的信息与其他指标所包含的信息之间的相关性引起的,通过降维的处理我们提取了主成分,就像是把指标体系所包含的信息分了类,某一大类由一个主成分来表现,这样就消除了产生多重共线性问题的根源———信息的交迭。 主成分回归分析虽然比较好地解决了多重共线性问题,但仍存在很多不足之处,比如:主成分的实际含义不明确,主成分与因变量之间的关系不很直接,估计出的参数是有偏的等等。 使用SPSS中Stepwise回归分析 直接使用 SPSS 系统给定的逐步回归法进行回归分析,有时难以得到所需要的分析结果,因为系统给出的最终结果仅是一个满足统计学检验的结果,该结果不一定满足实际问题的需要。 为分析影响服务业发展的因素, 引入如下指标: 用第三产业产值占 GDP 的比重作为反映服务业发展水平的指标(y, 单位: %); 1.城乡居民收入水平指标 (x1, 单位元); 2.城市化水平的指标(x2, 单位: %); 3.人口密度(x3, 单位: 人/每平方公里); 4.居民年消费水平(x4, 单位: 元); 5.食品消费所占比重 (x5, 单位: %); 6.个体私营经济从业人员占社会从业员的比重 (x6, 单位: %); 7. 实际外商直接投资在全社会固定资产投资中所占比例 (x7, 单位: %)。 为解决由自变量之间的相关性导致的多重共线性, 在Method 一栏中选择 stepwise 进行回归分析, 得到如下方程: y= - 22.699 + 0.01063x1+0.06917x3- 0.00913x4 (- 2.353) (2.953) (5.145) (- 2.322) R2=0.956, F=168.813 在显著水平为 0.05 时, 估计方程及其所有估计系数都通过检验。然而我们进一步分析发现, x4 在这里表示的是居民年消费水平, 其系数为负, 表示 x4 每增加一个单位, y 将减少 0.00913 个单位, 从经济学意义上来说, 这是不合理的, 因此, 不能作为分析的最终结果。 本例

文档评论(0)

jiquhe72163 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档