一元线性回归方程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
证明: = = 由于: = = = = 0 所以: = + 总离差平方和 = 回归平方和 + 残差平方和 TSS = ESS + RSS 可决系数 + = 1 回归平方和在总离差平方和中所占的比重越大,说明样本回归直线对样本值拟合的程度越好。因此,用来表示拟合优度的样本可决系数定义为: R2 = = = = = R2 的取值范围是 [0,1]。 对于一组数据,TSS是不变,所以ESS↑(↓),RSS↓(↑) R2=0时 表明解释变量X与被解释变量Y之间不存在线性关系; R2=1时 表明样本回归线与样本值重合,这种情况极少发生; 一般情况下,R2越接近1表示拟合程度越好,X对Y的解释能力越强。 另外: R2 = = = R2 = = = 相关系数与可决系数的关系 (1)样本相关系数是建立在相关分析的基础之上的,研究的是随机变量之间的关系;可决系数则是建立在回归分析基础上,研究的是非随机变量X对随机变量Y的解释程度。 (2)取值上,可决系数是样本相关系数的平方。 (3)样本相关系数是由随机的X和Y抽样计算得到,因而相关关系是否显著,还需进行检验。 可决系数 相关系数 就模型而言 就两个变量而言 说明解释变量对应变量的解释程度 度量两个变量线性依存程度。 取值:[0,1] 取值:[-1,1] 点预测Yi 区间预测 (1)单个值Yi的区间预测 (2)均值E(Yi)的区间预测 一元线性回归方程的预测 如果经过检验,样本回归方程的拟合优度好,且回归系数的估计值显著不为0,则可以用回归方程进行预测。预测分为点预测和区间预测。 1、点预测 假设XF为解释变量的一个已知点,则带入样本回归方程 即可得到YF的估计值: 2、区间预测 估计值 是一个点预测值,它可以是(1)总体真值YF的预测值;也可以是(2)总体回归线E(YF|XF)的预测值。现在根据 来对(1)(2)进行区间预测。 E(YF|XF) 的预测区间是: (1)条件期望E(Y0|X0)的预测区间 YF的预测区间是: SRF 各种预测值的关系 Y的个别值的置信区间 Y均值的置信区间 利用OLS方法得到一个样本回归模型(一条样本回归线)后,问题结束了吗? 为什么要用普通最小二乘法? 样本回归模型有无穷多个,我们仅仅得到其中一个,它能反映真实的总体回归模型吗? 样本回归模型对数据的拟合程度可以接受吗? 如何用样本回归模型进行预测? 问题结束了吗? ?1 密度函数 假定1:解释变量是非随机的。 假定2: 零期望假定:E(ui) = 0。 E(ui|Xi) = 0。 古典线性回归模型的基本假定 E(Y|Xi) = ?0 + ?1 Xi X Y 0 假定3:同方差性假定:Var(ui) = E[ui - E(ui) ]2 = E(ui2) = ? 2。 X Y 0 X Y 0 同方差 异方差 假定4:无序列相关(无自相关)假定: Cov(ui, uj) = E[(ui - E(ui) ) ( uj - E(uj) )] = E(uiuj) = 0, (i ? j )。 无自相关 正自相关 负自相关 假定5:ui服从正态分布, ui ~N(0,?2) 假定6*:解释变量X与随机误差项u不相关 Cov(ui, Xi) = E[(ui - E(ui) ) (Xi - E(Xi) )] = E(ui Xi) = 0 如果X为确定性变量,该假定自然满足 假定7*:回归模型是关于参数线性的,但不一定关于变量线性。 其他一些假定的说明: OLS估计量的性质 高斯-马尔可夫定理 如果满足古典线性回归模型的基本假定(假定1-假定4),则在所有的线性估计量中,OLS估计量是最优线性无偏估计量(BLUE)。 线性性 无偏性 有效性 都是Yi的线性函数。 证明: = = = 令 代入上式,得: = 线性性 线性估计量的处理要比非线性估计量更为容易 证明: = = = = = = 无偏性 =?1 ??1 无偏估计量 有偏估计量 OLS估计量的方差比其他线性无偏估计量的方差都小。 最小方差性与有效性 ?1 一致性(了解) ?1 概率密度 OLS估计量的方差 为什么要估计方差? 方差反映了数据的离散程度和估计结果的精确性。 受教育年限与每小时工资 ?1 总体(随机误差项)真实方差?2的估计量: ?2的估计 受教育年限与每小时工资 OLS

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档