- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
§4.5 异常值与强影响值 二、关于自变量x的异常值 §4.5 异常值与强影响值 二、关于自变量x的异常值 虽然强影响点并不总是y的异常值点,不能单纯根据杠杆值hii的大小判断强影响点是否异常,但是我们对强影响点应该有足够的重视。为此引入库克距离,用来判断强影响点是否为y的异常值点。库克距离的计算公式为: §4.5 异常值与强影响值 二、关于自变量x的异常值 对于库克距离,判断其大小的方法比较复杂,一个粗略的标准是 当Di0.5时,认为不是异常值点, 当Di1时, 认为是异常值点。 §4.5 异常值与强影响值 异常值原因 异常值消除方法 1.数据登记误差,存在抄写或录入 的错误 重新核实数据 2.数据测量误差 重新测量数据 3.数据随机误差 删除或重新观测异常值数据 4.缺少重要自变量 增加必要的自变量 5.缺少观测数据 增加观测数据,适当扩大自变量取值范围 6.存在异方差 采用加权线性回归 7.模型选用错误,线性模型不适用 改用非线性回归模型 自变量选择与逐步回归 如何选择最适当的变量和最适当的回归方程 选择变量的标准是什么 2. 多重共线性的情形及其处理 多重共线性的判断方法和处理方法 3. 岭回归 适用情况和使用方法 4. 非线性回归 5 含定性变量的回归模型 需要特别注意的其他问题 * * * Rejection region does NOT include critical value. * Rejection region does NOT include critical value. 3.6 相关阵与偏相关系数 三、偏相关系数 对任意p个变量x1,x2,…,xp定义它们之间的偏相关系数 其中符号Δij表示相关阵第i行第j列元素的代数余子式 验证 3.7 实例 例3.3 中国民航客运量的回归模型。 y—民航客运量(万人), x1—国民收入(亿元), x2—消费额(亿元), x3—铁路客运量(万人), x4—民航航线里程(万公里), x5—来华旅游入境人数(万人)。 根据《1994年统计摘要》获得1978-1993年统计数据 3.7 年份 y x1 x2 x3 x4 x5 1978 231 3010 1888 81491 14.89 180.92 1979 298 3350 2195 86389 16.00 420.39 1980 343 3688 2531 92204 19.53 570.25 1981 401 3941 2799 95300 21.82 776.71 1982 445 4258 3054 99922 23.27 792.43 1983 391 4736 3358 106044 22.91 947.70 1984 554 5652 3905 110353 26.02 1285.22 1985 744 7020 4879 112110 27.72 1783.30 1986 997 7859 5552 108579 32.43 2281.95 1987 1310 9313 6386 112429 38.91 2690.23 1988 1442 11738 8038 122645 37.38 3169.48 1989 1283 13176 9005 113807 47.19 2450.14 1990 1660 14384 9663 95712 50.68 2746.20 1991 2178 16557 10969 95081 55.91 3335.65 1992 2886 20223 12985 99693 83.66 3311.50 1993 3383 24882 15949 105458 96.08 4152.70 3.7 3.7 3.7 本章小结与评注 4 违背基本假设的情况 4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计 4.3 多元加权最小二乘估计 4.4 自相关性问题及其处理 4.5 异常值与强影响点 违背基本假设的情况 Gauss-Markov条件 4.1 异方差性产生的背景和原因 一、异方差产生的原因 例4.1 居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为: yi=β0+β1xi+εi,i=1,2,…,n 低收入的家庭购买差异性比较小, 高收入的家庭购买行为差异就很大。 导致消费模型的随机项εi具有不同的方差。 4.1 异方差性产生的背景和原因 二、异方差性带来的问题 当存在异方差时,普通最小
您可能关注的文档
最近下载
- 2025年福建高考化学卷及答案(新课标卷).docx VIP
- 小学生控笔训练.docx VIP
- 中级日语(N3)中常用的副词总结讲义--日语等级考试备战.docx VIP
- 2025年高中地理世界地理高考试题汇编.doc VIP
- 人工智能大数据支持背景下循证教学的实施研究课题申报评审书.pptx VIP
- 再审申请听证申请书范文.docx VIP
- 《综合英语I》课程教学创新成果报告.pdf VIP
- 渗透作用课件.ppt VIP
- 专题21 散文阅读(同步练习)(解析版)【中职专用】2024届高三语文(对口升学)一轮复习备考指南(湖南适用).docx VIP
- 2025年铭记历史勿忘国耻纪念九一八事变学习ppt课件.pptx
文档评论(0)