- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4讲 线性回归模型的扩展.ppt
第四讲 线性回归分析的扩展Linear Regression Analysis: Extension 一、引言:放宽经典模型的假设 二、多重共线性 三、异方差性 四、序列相关 五、设定误差 引言:放宽经典模型的假设 经典正态线性回归模型(CNLRM)的假定 (一)关于模型的假定 回归模型对参数而言是线性的 模型是正确设定的 (二)关于解释变量的假定 解释变量X是确定性变量 若X是随机的,则误差项与X不相关 解释变量的取值有足够变异 解释变量之间不存在完全的线性关系 引言:放宽经典模型的假设 经典正态线性回归模型(CNLRM)的假定 (三)关于误差项的假定 对于给定的X,误差项均值为0 对于给定的X,误差项方差相等 对于给定的X,误差项之间不存在序列相关 误差项服从正态分布 引言:放宽经典模型的假设 引言:放宽经典模型的假设 微数缺测性 从理论上讲,样本容量n和解释变量数目k必须满足nk+2,才能进行OLS估计和假设检验。但事实上,即便n满足上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过t检验。 什么是多重共线性 多重共线性(multicollinearity):回归模型中的一些或全部解释变量之间存在一定程度的线性关系 什么是多重共线性 例题4.1 其他例题:p200 什么是多重共线性 图形表示:巴伦坦图 什么是多重共线性 产生多重共线性的原因 样本过小 模型设定有误:添加了过多的解释变量 由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系 多重共线性的影响 存在完全线性关系时的OLS估计 无法得到OLS估计量 例题:p201-202 多重共线性的影响 存在多重共线性关系时的OLS估计 可以证明即便存在多重共线性,OLS估计量仍然是BLUE,但系数估计量的方差较大,从而不容易通过t检验,同时预测区间变宽,降低了预测精确度。 多重共线性的影响 影响程度的度量:方差膨胀因子(variance-inflation factor) 多重共线性的影响 例题4.2 多重共线性的诊断 简单诊断方法 R2高而单个系数的t值小,换言之,F检验显著,但显著的t值少 任意两个解释变量之间的相关系数较大,比如大于0.9 解释变量之间的偏相关系数较大 简单方法一般来说不很精确 多重共线性的诊断 运用回归分析进行诊断 逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量。如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或t统计量明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量 辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的F统计值,如果在给定的显著性水平下F统计值是显著的,说明该解释变量与其他解释变量之间存在线性关系,可以去掉该解释变量(p207,p211) 多重共线性的诊断 运用一些指标进行诊断 方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一般认为如果VIF大于10,说明该变量与其他变量存在高度共线性 容许度(tolerance):定义容许度TOL如下,一般认为如果TOL小于0.1,说明该变量与其他变量存在高度共线性 条件指数(condition index, CI):一般认为,如果条件指数在10到30之间,存在较强的多重共线性,如果大于30,则存在严重的多重共线性 多重共线性的诊断 例题4.3(p218) 多重共线性的诊断 几点说明 多重共线性是一个程度问题而不是存在与否的问题 多重共线性是关于样本的一种特征 如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大 多重共线性的处理 剔除共线性变量中不太重要的解释变量 补充新数据 重新设定模型 练习题:p216-217,习题10.14-10.19
文档评论(0)