[理学]实用回归分析.ppt

  1. 1、本文档共132页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]实用回归分析

§4.5 异常值与强影响值 二、关于自变量x的异常值 §4.5 异常值与强影响值 二、关于自变量x的异常值 §4.5 异常值与强影响值 二、关于自变量x的异常值 虽然强影响点并不总是y的异常值点,不能单纯根据杠杆值hii的大小判断强影响点是否异常,但是我们对强影响点应该有足够的重视。为此引入库克距离,用来判断强影响点是否为y的异常值点。库克距离的计算公式为: §4.5 异常值与强影响值 二、关于自变量x的异常值 对于库克距离,判断其大小的方法比较复杂,一个粗略的标准是 当Di0.5时,认为不是异常值点, 当Di1时, 认为是异常值点。 §4.5 异常值与强影响值 异常值原因 异常值消除方法 1.数据登记误差,存在抄写或录入 的错误 重新核实数据 2.数据测量误差 重新测量数据 3.数据随机误差 删除或重新观测异常值数据 4.缺少重要自变量 增加必要的自变量 5.缺少观测数据 增加观测数据,适当扩大自变量取值范围 6.存在异方差 采用加权线性回归 7.模型选用错误,线性模型不适用 改用非线性回归模型 自变量选择与逐步回归 如何选择最适当的变量和最适当的回归方程 选择变量的标准是什么 2. 多重共线性的情形及其处理 多重共线性的判断方法和处理方法 3. 岭回归 适用情况和使用方法 4. 非线性回归 5 含定性变量的回归模型 需要特别注意的其他问题 * * * Rejection region does NOT include critical value. * Rejection region does NOT include critical value. 3.6 相关阵与偏相关系数 三、偏相关系数 用y与x1做一元线性回归时,x1能消除y的变差SST的比例为 再引入x2时,x2能消除剩余变差SSE(X1)的比例为 因而自变量x1和x2消除y变差的总比例为 =1-(1-0.651)(1-0.546)=0.842=84.2%。 这个值84.2%恰好是y对x1和x2二元线性回归的判定系数R2 3.6 相关阵与偏相关系数 三、偏相关系数 对任意p个变量x1,x2,…,xp定义它们之间的偏相关系数 其中符号Δij表示相关阵第i行第j列元素的代数余子式 验证 3.7 实例 例3.3 中国民航客运量的回归模型。 y—民航客运量(万人), x1—国民收入(亿元), x2—消费额(亿元), x3—铁路客运量(万人), x4—民航航线里程(万公里), x5—来华旅游入境人数(万人)。 根据《1994年统计摘要》获得1978-1993年统计数据 3.7 年份 y x1 x2 x3 x4 x5 1978 231 3010 1888 81491 14.89 180.92 1979 298 3350 2195 86389 16.00 420.39 1980 343 3688 2531 92204 19.53 570.25 1981 401 3941 2799 95300 21.82 776.71 1982 445 4258 3054 99922 23.27 792.43 1983 391 4736 3358 106044 22.91 947.70 1984 554 5652 3905 110353 26.02 1285.22 1985 744 7020 4879 112110 27.72 1783.30 1986 997 7859 5552 108579 32.43 2281.95 1987 1310 9313 6386 112429 38.91 2690.23 1988 1442 11738 8038 122645 37.38 3169.48 1989 1283 13176 9005 113807 47.19 2450.14 1990 1660 14384 9663 95712 50.68 2746.20 1991 2178 16557 10969 95081 55.91 3335.65 1992 2886 20223 12985 99693 83.66 3311.50 1993 3383 24882 15949 105458 96.08 4152.70 3.7 3.7 3.7 本章小结与评注 4 违背基本假设的情况 4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计 4.3 多元加权最小二乘估计 4.4 自相关性问题及其处理 4.5 异常值与强影响点 违背基本假设的情况 Gauss-Markov条件 4.1 异方差性产生的背景和原因 一、异方差产生的原因

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档