-1一元线性回归 (3.pptVIP

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5-1一元线性回归(3

有影响的观测值 (图示) 不存在影响值的趋势 有影响的观测值 存在影响值的趋势 杠杆率点 如果自变量存在一个极端值,该观测值则称为高杠杆率点(high leverage point) 在一元回归中,第i个观测值的杠杆率用hi表示,其计算公式为 如果一个观测值的杠杆率 ,就可以将该观测值识别为有高杠杆率的点 一个有高杠杆率的观测值未必是一个有影响的观测值,它可能对回归直线的斜率没有什么影响 高杠杆率点 (图示) 高杠杆率点 * * * * * * * 124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx) 四.回归方程的显著性检验 H0: β1= 0 vs H1: β1≠0 ①. 提出假设 为寻找检验 H0 的方法,将 x 对 y 的线性影响与随机波动引起的偏差平方和分开。 数据总的波动的偏差平方和 回归值记为 残差记为 1、F 检验 误差的分解 (图示) x y y ? 反映了回归自变量的波动 反映了其它因素的影响 记 回归平方和 残差平方和 可证: 在计算时: 定理: 设 y1,y2,…,yn 相互独立,且 则上述记号下,有 (1) (2) (3) SR与Se、 独立. 关于 SR 与 Se 的分布 故: 进一步,若 H0 成立,则有 ②、选择检验统计量 ③、对于给定的显著性水平α,当 时, 就拒绝 H0, 认为回归方程有显著意义. t -检验 (1) (2)检验统计量: (3) (4) 若 t t1-?/2, 拒绝 H0 若 t ? t1-?/2, 不拒绝 H0 查 |r| 分布的临界值表 (附表7) 得 r1-?(n-2),当 |r|≥ r1-?(n-2) 时拒绝 H0 检验统计量: 样本相关系数 r 提出假设 H0: ρ = 0 vs H1: ρ ≠0 相关系数检验: 设ρ为二维总体 (x, y) 的相关系数 注: 称 r2为判定系数, 它度量了经验回归方程对观测数据的拟合程度. 0≤r2≤1, 它的值越大, 表明因变量与自变量之间的相关性越强. 例1(续):应用合金强度与碳含量的数据,得到了回归方程.试用相关系数法验证回归方程的显著性。 查表得临界值 r1-?(n-2)=r0.99(10)=0.708, 从而拒绝 H0. ?=0.01时, (1) y 与 x 之间的关系不是线性关系; 回归效果不显著的原因分析: (2) 影响 y 取值的,除 x 及随机误差外,还有其它不可忽略的因素; (3) y 与 x 之间可能不存在关系。 已知 ,寻求均值 的点估计与区间估计. (1) Ey0的点估计:即为回归方程计算所得回归值. 当回归方程经过显著性检验之后,可用来估计和预测. 五.估计与预测 1. Ey0的估计问题. (2) E y0 的区间估计: 由于 且与 相互独立. 置信区间为 其中 所求即 x=x0 时,对应 y0 的1-α取值区间. 由于 2. y0的预测区间.(个值预测) Ey0 的区间估计(均值预测) 所以 y0 的1-α预测区间为 其中 置信区间、预测区间、回归方程 xp y x ?x 预测上限 置信上限 预测下限 置信下限 1. 线性回归模型不宜用于长期预测。 2. 事物发展与历史数据的趋势有过大的差异。 例如:航空运量的增长在1996年以前是经济增长的线性趋势。 应用回归模型需要的注意问题 1996 补充:残 差 分 析 1 用残差证实模型的假定 2 用残差检测异常值和有影响的观测值 残 差 因变量的观测值与根据估计的回归方程求出的预测值之差,用 e 表示 反映了用估计的回归方程去预测而引起的误差 用残差证实模型的假定 残 差 图 表示残差的图形 关于 x 的残差图 关于 y 的残差图 标准化残差图 用于判断误差 ? 的假定是否成立 检测有影响的观测值 残差与标准化残差图 (例题分析) 残 差 图 ? ? ? ? ? ? ? ? ? ? (a)满意模式 ? ? ? ? ? ? ? ? ? ? ? 残差 x ? 0 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (b)非常数方差 ? ? ? ? ? ? ? ? ?

您可能关注的文档

文档评论(0)

rovend + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档