方差扩大因子分布与应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
方差扩大因子分布与应用

方差扩大因子分布与应用   摘 要:多重共线性的判断方法的局限性,是统计学界一直关注的问题。对于方差扩大因子检验的方法,大多数文献中持有这样一种观点:当方差扩大因子大于等于10时,解释变量之间有严重的多重共线性。这种说法不够精确,文章用方差扩大因子方法判断多重共线性的范围进行讨论与研究,进而对判断多重共线性有一个精确的认识。   关键词:方差扩大因子 多元线性回归模型      多重共线性的判断方法的局限性,是统计学界一直关注的问题。对于方差扩大因子检验的方法,大多数文献中持有这样一种观点:当方差扩大因子大于等于10时,解释变量之间有严重的多重共线性。这种说法不够精确,本文用方差扩大因子方法判断多重共线性的范围进行讨论与研究,进而对判断多重共线性有一个精确的认识。   一、方差扩大因子的分布与应用   通过对方差扩大因子定义的推导,本文得到以下结论:   在H0∶β2=β3…βk=0成立时,方差扩大因子VIFj的密度函数V(x)为:         其中:      方差扩大因子法是判断多重共线性的一种重要方法,利用其分布可以得到在给定各个显著性水平的条件下的临界值表,进而可以根据不同自由度对应的临界值来判断模型中是否存在多重共线性。   在相关系数检验法中提到对样本中任何两个不同解释变量求简单相关系数,如果相关系数r的绝对值比较大,如|r|0.8或|r|0.9,即认为这两个样本之间高度相关,因而样本存在多重共线性。在方差扩大因子检验的方法中,这种情况也是成立的。   用方差扩大因子VIF作为判断多重共线性主要是由于影响其拟合优度的变化,即受R2i的影响,如在给定显著性水平α=0.1时,当两个自由度分别为8和3时,通过查表得VIFj=15.00,即根据一般文献的说法,只有当方差扩大因子大于15.00时,模型出现多重共线性,但当10VIFj15.00时,却不一定出现多重共线性的现象。同样,在给定显著性水平α=0.025,当两个自由度分别为12和4时,通过查表得VIFj=27.25,即根据一般文献的说法,只有当方差扩大因子大于27.25时,模型出现多重共线性。但当10VIFj27.25时,却不一定出现多重共线性的现象。同样,在α=0.05时,也存在这样的现象。   由此可知,方差扩大因子大于等于10不一定会出现多重共线性的现象。   总之,从方差扩大因子的临界值表中可以得到这样的结论:文献中出现的“当方差扩大因子大于等于10时,解释变量之间有严重的多重共线性”这样说法不够精确。对于给定不同的显著性水平下,不同的自由度对应有不同的方差扩大因子的临界值,方差扩大因子大于等于10,模型存在多重共线性在一些情况下是正确的。但并不能说明,只要方差扩大因子大于等于10就存在多重共线性,大于10也存在没有多重共线性的情况。   二、方差扩大因子分布的应用实例   方差扩大因子的分布有一个重要的应用,就是可以用于判定模型是否有多重共线性。本文举例说明方差扩大因子的分布在判定多重共线性方面的应用。资料来源于计量经济学定量分析影响中国旅游市场发展的主要因素。分析得到:影响其主要因素除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。因此,考虑的影响因素主要有国内旅游人数X2,城镇居民人均旅游支出X3,农村人均旅游支出X4,并以公路里程X5和铁路里程X6作为相关基础设施的代表。设定如下的计量经济模型:   Yt=β1+β2X2t+β3X3t+β4X4t+β5X5t+β6X6t+ut   其中,Yt为第t年的全国旅游收入(亿元),X2为国内旅游人数(万人/次),X3为城镇居民人均旅游支出(元),X4为农村人均旅游支出(元),X5为公路里程(万千米),X6为铁路里程(万千米)。为估计模型参数,旅游事业最快发展的1994-2003年的统计数据如表1所示:   表1   年份 国内旅游收入Y 国内旅游人数(万人/次) 城镇居民人均旅游支出(元) 农村人均旅游支出(元) 公路里程(万千米) 铁路里程(万千米)   1994 1023.500 52400.00 414.7000 54.90000 111.7800 5.900000   1995 1375.700 62900.00 464.0000 61.50000 115.7000 5.970000   1996 1638.400 63900.00 534.1000 70.50000 118.5800 6.490000   1997 2112.700 64400.00 599.8000 145.7000 122.6400 6.600000   1998 2391.200 69450.00 607.0000 197.0000 127.8500 6.640

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档