- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 很显然,除非 和 同时成立,否则的均值不可能在两个时期都始终为0。 如果两个等式同时成立,就意味着两个时期参数没有变化,与假设的情况不一致。因此在参数发生改变时,必然导致误差项均值非0的问题。 * 二、发现与判断 发现和判断模型参数改变的基本方法,也是经济问题背景分析和残差序列分析相结合。 如果以i为横轴,残差e为纵轴的残差序列分布,存在某个时刻附近转折的情况,如图5.8所示,应该考虑变量关系在该时刻可能存在参数改变。 * 图5.8 参数变化 * 根据情况分析和残差序列图的判断不是绝对可靠的,问题典型性不强时更难下结论。 而且变量关系非线性、解释变量缺落和参数变化等问题在残差分布中的表现往往很相似,因此准确识别的难度很大,常常需要借助经验和用试错的方法进行判断。 检验线性回归模型结构(参数)稳定性,另外有一种专门的“邹检验”(Chow test)方法。 * 具体方法是以怀疑发生结构(参数)变化的时点为界,把观测样本分为两组 。 然后用两组子样本和全样本分别进行回归,将两组子样本回归的残差平方和加总得到 ,称为“无约束残差平方和”,再与全样本回归的残差平方和 ,称为“有约束的残差平方和”,构造下列F统计量: * 其中K是模型(不包括常数项)的解释变量个数, 和 分别是两个子样本的样本容量。 该统计量服从两个自由度为K+1和 的F 分布。 因此,如果该F 统计量不大于相应自由度的F 分布临界值,说明有约束和无约束的两个回归残差平方和的差别不明显,模型结构(参数)并没有发生显著变化。反之则说明模型结构确实发生了明显变化。 * 模型参数改变问题的处理方法比较简单,根据参数改变的时间分不同时段进行分段回归就可以解决这些问题。 在作处理以后,还可以通过对处理后回归结果的比较,确定初步判断是否正确并进一步调整。 * 【例5-3】 这里用[例5-1]中存在变量关系非线性问题的例子,作为邹检验的例子。 根据数据散点图和残差序列图显示的情况,我们直接把1972到1973年作为发生可能的结构变化的转折点,也就是把样本区间分为[1950,1972]和[1973,1985]两个区间。 直接对这两个样本区间分别回归,得到两个残差平方和分别为2041.117和2577.161,因此邹检验的无约束残差平方和为4618.278。 * 前面已经得到整个样本区间回归的残差平方和,也就是邹检验的有约束残差平方和为12067.83。 把这两个残差平方和与样本容量和模型解释变量数一起代入邹检验的F统计量,得到 =25.82 显然,该统计量是显著的,可以认为模型的结构发生了变化。 * 回归残差序列分析发现和判断异常值问题的方法 在模型假设成立的前提下,回归残差是服从正态分布的随机变量,其取值95%左右的概率应分布在均值加减2倍标准差的范围内。 如果发现某个残差 出现: 其中 是残差的标准差,模型在时点i处就很可能存在异常值问题。 * 上述回归残差序列分析等价于下列残差序列图分析。 把根据回归残差序列和残差标准差计算出的 /S数据序列,描绘到以i为横轴,以 /S为纵轴的坐标平面上,再在纵轴的 处画上两条水平的临界线。 以误差序列中是否有点落在两条临界线范围之外作为判断异常值的初步标准。 * 图5.4 异常值的残差序列图检验 * 用EViews软件进行回归分析可以直接输出残差序列图,并且在图形中包括有两倍标准差的临界值,因此可以直接根据EViews输出的残差序列图判断是否有异常值的可能性。 如果有个别 /S坐标落在两条临界线的范围以外,就意味着在i 时点上有异常值。 当然,如果落在临界线以外的点有多个,那么一方面可以考虑存在多个异常值的可能性,另外也应该怀疑存在其他系统性偏差。 * 存在多个较大残差不能简单地认为是多个异常值,而是应该作进一步的深入分析,结合对其他问题的分析进行判断。 此外,上述残差序列判断异常值的临界值标准是95%置信度的,当 /S的绝对值落在2到3之间时,用95%的置信度判断有异常值,而用99%的置信度判断则可能没有异常值,因此仍然存在模糊的地方。 这时候必须与问题背景分析结合起来考虑,并考虑各点残差相对情况等。 * 三、问题的处理 如果判断模型存在异常值问题,必须作针对性
您可能关注的文档
最近下载
- 高中地理人教版必修 第二册第三章 产业区位因素第三节 服务业区位因素及其变化.pptx
- 医养中心营销策划方案.pdf VIP
- 2025年医疗服务行业人力资源报告:医护人员职业发展现状与趋势.docx
- 电气设备-独家解析-特斯拉4680电池结构与工艺设计-杭州车知知.docx
- 民族团结进步.pptx VIP
- 【OBE课程改革】《统计学》课程教学模式创新与实践.pdf VIP
- 武汉地区区域工程地质及水文地质概况、成井方法、基坑工程连通性抽水试验、降水水位计算与预测、回灌试验技术要求.pdf VIP
- 生产车间5s管理制度.docx VIP
- 【完整版】视频会议系统_本科毕业论文设计.docx VIP
- 国新基金组织架构.docx VIP
文档评论(0)