- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多重共线性在职
经典回归模型的假设 1、回归模型对参数而言是线性的; 2、各自变量X的值在重复抽样中是固定的; 3、对给定的X,随机干扰项ui的均值为零; 4、对给定的X,随机干扰项ui的方差不变; 5、对给定的X,随机干扰项ui无自相关; 6、如果X是随机的,则干扰项与各X是独立的或不相关; 7、观测次数必定大于自变量的个数; 8、自变量的取值必须有足够的变异性; 9、回归模型是正确设定的; 10、自变量之间无准确的线性关系,即无多重共线性; 11、随机干扰项ui是正态分布的。 经典假定的分类 上述经典假定在实际应用中可以划分为两类: (1)关于对模型设定和对随机干扰项ui的假定问题;如上述假定中的1、2、3、4、5、9、11; (2)关于对数据的假定问题,如上述假定中的6、7、8和10; 第一类 经典假定面临的问题 1、要偏离一个具体的假定多远才会产生不可忽视的差别,如正态分布问题; 2、在一个具体问题中,怎样能发现某一假定是否被破坏?如正态性检验:卡方检验 3、如果一个或多个假定是错误的,我们能采取什么补救性措施,如异方差问题 第二类经典假定面临的问题 1、某一具体问题的严重性如何,如多重共线性问题; 2、怎样确定数据问题的严重性 3、一些数据缺陷是否容易得到补救? 由于各种原因,无法对这些问题都给出令人满意的答案。从本章开始,只研究部分问题 第 3 章 多重共线性 §3.1多重共线性的性质 1.完全共线性: 即变量存在下列线性关系: 2.欠完全线性关系:是指解释变量与误差项存在下列线性关系: 多重共线性的影响 如果多重共线性是完全的,各X变量的回归系数将是不确定的,并且其标准误为无重大 如果多重共线性是欠完全的,那么,回归系数虽然可以确定,但标准误较大,回归系数的估计精确度下降 出现多重共线性时,估计值稳定性差,有时回归方程整体高度显著,有些回归系数则通不过显著性检验,回归系数的符号也可能出现倒置,使得无法对回归方程得到合理的经济解释直接影响到最小二乘法的应用效果,降低回归方程的应用价值 3.产生多重共线的原因: (1) 数据采集所用的方法。如抽样限于总体中各自变量所取值的一个有限范围内; (2) 模型或从中取样的总体受到约束。如电力消费对收入和住房面积的回归时,总体中的有形约束是:收入较高的家庭通常比收入较低的家庭有较大的的住房 (3) 模型设定。如在回归模型中添加多项式 (4) 一个过度决定的模型.即模型中的自变量个数大于观测次数,即kn. §3.2出现完全多重共线性时的估计问题 1.回归系数的不确定性(以三元为例): 2.从(3.2.2)看出,它是一个不定式,说明个别回归系数的确定不是唯一的. §3.3 出现不完全多重共线性时 的估计问题 1.对于(3.2.1)的模型来说,若 2.将(3.3.1)代入前述参数求解式得: 3.如果 充分的小,(3.3.2)就回到(3.2.2). §3.4 多重共线性的理论后果 (1)对于近似多重共线性而言,OLS估计量仍然是无偏的。但无偏性是重复抽样的性质。即固定X变量反复抽取样本,并对每一个样本计算OLS估计量,随着样本个数的增加,估计量的样本值的均值收敛于真实总体值。 (2)虽然说共线性并不破坏最小方差性质,但并不意味着在任一给定的样本中,一个OLS估计量的方差一定是最小的。 (3)虽然多重共线性是一种样本现象,即总体中各X变量没有线性关系,但具体获得的样本有可能存在线性关系。此时,利用样本回归估计总体回归时,难以区分各X变量对Y的影响。 §3.5 多重共线性的实际后果 1.多重共线产生的实际后果 (1).OLS估计是BLUE,但有大的方差和协方差,故难以作出精确的估计, (2).置信区间扩大,易接受“零虚拟假设”. (3).系数的t统计上不显著. (4).虽然t统计量不显著,但其拟合优度高. (5).OLS估计量及标准误差对数据的小变化敏感. 2.OLS估计量的大方差与协方差 (1)方差协方差的计算公式: 从上述公式可见,随着X变量共线性增加,两各估计量的方差也增加,当两个自变量之间的相关系数为1时,方差变为无穷大。 (2).方差膨胀因子: 方差膨胀因子与回归系数估计值的方差成正比关系,可以手工计算 §3.6 多重共线性的侦察 1. 值高而显著的t比率少. 2.自变量之间有高度的两两相关 如果自变量之间的简单相关系数都很高,表明有可能存在多重共线性,但是高的简单相关系数是多重共线性存在的充分条件,而不是必要条件。即使简单相关系数不显著,也可能存在多重共线性。 (以四变量模型为例说明). 假定有:
文档评论(0)