- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1、岭回归 岭回归的基本性质 2、主成分回归 主成分分析是一种常用的降维方法,它在信息损失最小的原则下,往往可以将变量数大大减少,而且可以在理论上保证所获得的新变量(主成分)之间不相关 2、主成分回归 基本思想 2、主成分回归 主成分分析过程的实质就是对原坐标系进行平移和旋转变换 2、主成分回归 第一主成分就对应数据变异的第一大方向,对原始数据的变异最具解释力; 第二主成分就对应数据变异的第二大方向; …… 不同主成分之间不相关 主成分是自变量的线性组合 2、主成分回归 判断应选择几个主成分,主要依据贡献率: 2、主成分回归 主成分回归的基本步骤 1)进行主成分分析,得到主成分 2)以主成分为自变量进行建模 主成分方法本身也会受到共线性的干扰 3、回归检验 首先获得残差,然后以残差为被解释变量,以其他期残差为解释变量,建立线性回归模型,如果模型通过检验,拒绝原假设,就认为存在显著自相关。 该方法的优点在于:判断自相关的同时,就确定了自相关的模式 3、回归检验 4、游程检验(runs test ) 游程定义为:一个符号的不中断历程,游程长度为一个游程中元素个数 (四)自相关的处理 处理自相关主要采用的方法是差分法,通过差分可以消除自相关 差分法中最简单的形式为一阶差分法,除此之外一般都称为广义差分法 对广义差分法而言,关键是估计自相关系数 一阶差分法 适用于原数据存在较高程度的一阶自相关 一阶差分法 一阶差分法实际就是用增量数据代替原数据 广义差分法 适用于自相关系数不是很接近1时的情况 (以一阶自相关为例) 广义差分法 广义差分法实现的关键就在于对自相关系数的估计 自相关系数的估计 根据DW统计量进行估计 Durbin两步法 自相关系数的估计 根据DW统计量进行估计 自相关系数的估计 Durbin两步法 三、共线性问题及其处理方法 何为共线性问题 共线性的影响 共线性的诊断 共线性的处理 何为共线性问题 所谓共线性,是指自变量之间存在线性关系,所谓“之间”,不仅限于两个变量,还指某个变量与某些变量。总之,任一变量是或近似为其它变量的某种线性组合的现象,就是共线性。 共线性的影响 1.如果自变量完全线性相关,解是不唯一的,相应回归系数无法估计 要获得估计,必须能够求逆 共线性的影响 共线性的影响 共线性的影响 2.如果并非完全线性相关,回归系数虽可估计,但回归系数标准误将随相关程度的增强而迅速加大 共线性的影响 共线性的影响 标准误过大,将使得回归系数的波动性很大,对样本值非常敏感,因此也降低了回归方程的价值 t检验是建立在标准误基础上的,因此存在共线性问题时,t值将减小,经常无法通过检验 共线性的影响 3.经常出现回归系数符号反常现象 共线性的影响 为考察回归系数的符号问题,而 肯定大于0,故可以去掉 共线性的影响 共线性的影响 4.如果存在共线性,则对回归系数的解释一般不再适用 共线性的诊断 经验式的诊断 1、简单相关系数、散点图(矩阵图) 2、回归系数符号出现异常 3、F检验很显著,t检验却都不显著 4、增加或删除一个变量或观测值,回归系数估计值发生很大变化 5、重要自变量回归系数的置信区间过大 6、样本点过少,一般都存在共线性 共线性的诊断 方差膨胀因子(VIF,Variance Inflation Factor) 共线性的诊断 方差膨胀因子可以度量回归系数的标准误相对于不存在线性相关时,增加了多少 共线性的诊断 condition indices(CI) 经验法则 CI在10到30之间,存在中等强度共线性 CI大于30,存在严重共线性 共线性的处理方法 比较系统的方法 岭回归 主成分回归 偏最小二乘 时序横截面模型 共线性的处理方法 其他方法: 增加数据量 删除变量 变量替换 变量组合 1、岭回归(ridge regression) 基本思想 1、岭回归 对于岭回归的实际应用而言,k(偏倚系数)的估计是关键,需要结合岭迹图进行判断 1、岭回归 用岭迹图判断k值的基本原则是: 回归系数的岭估计基本稳定 回归系数符号要合理 回归系数没有明显不合经济意义的绝对值 误差增大不多 4、White检验 一种比较节省自由度的方法是对如下函数建模并进行F检验 (三)异方差诊断方法 检验未能拒绝原假设,并不意味着不存在异方差 检验拒绝了原假设并不意味着存在异方差,其他如设定错误、序列相关也会导致类似的结果 (四)异方差的处理 处理异方差的方法按建模阶段大致可以分为三类: 数据变换 改进参数估计方法 改进检验统计量 1、加权最小二乘(WLS) 1、加权最小二乘(WLS) 权数的确定 在一元回归情况下,可以用类似Glejser检验中的方法得到异方差的确切形式 在多元回归情
文档评论(0)