一元线性回归方程.pptVIP

下载本文档

47
0
约7.13千字
约 69页
2016-01-21 发布于安徽
举报
版权申诉

一元线性回归方程.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

证明: = = 由于： = = = = 0 所以： = ＋总离差平方和＝回归平方和＋残差平方和 TSS = ESS + RSS 可决系数＋ = 1 回归平方和在总离差平方和中所占的比重越大，说明样本回归直线对样本值拟合的程度越好。因此，用来表示拟合优度的样本可决系数定义为： R2 = = = = = R2 的取值范围是 [0，1]。对于一组数据，TSS是不变，所以ESS↑（↓），RSS↓（↑） R2=0时表明解释变量X与被解释变量Y之间不存在线性关系； R2=1时表明样本回归线与样本值重合，这种情况极少发生；一般情况下，R2越接近1表示拟合程度越好，X对Y的解释能力越强。另外： R2 = = = R2 = = = 相关系数与可决系数的关系（1）样本相关系数是建立在相关分析的基础之上的，研究的是随机变量之间的关系；可决系数则是建立在回归分析基础上，研究的是非随机变量X对随机变量Y的解释程度。（2）取值上，可决系数是样本相关系数的平方。（3）样本相关系数是由随机的X和Y抽样计算得到，因而相关关系是否显著，还需进行检验。可决系数相关系数就模型而言就两个变量而言说明解释变量对应变量的解释程度度量两个变量线性依存程度。取值：[0,1] 取值：[－1,1] 点预测Yi 区间预测（1）单个值Yi的区间预测（2）均值E(Yi)的区间预测一元线性回归方程的预测如果经过检验，样本回归方程的拟合优度好，且回归系数的估计值显著不为0，则可以用回归方程进行预测。预测分为点预测和区间预测。 1、点预测假设XF为解释变量的一个已知点，则带入样本回归方程即可得到YF的估计值: 2、区间预测估计值是一个点预测值，它可以是（1）总体真值YF的预测值；也可以是（2）总体回归线E(YF|XF)的预测值。现在根据来对（1）（2）进行区间预测。 E(YF|XF) 的预测区间是: （1）条件期望E(Y0|X0)的预测区间 YF的预测区间是: SRF 各种预测值的关系 Y的个别值的置信区间 Y均值的置信区间利用OLS方法得到一个样本回归模型（一条样本回归线）后，问题结束了吗？为什么要用普通最小二乘法？样本回归模型有无穷多个，我们仅仅得到其中一个，它能反映真实的总体回归模型吗？样本回归模型对数据的拟合程度可以接受吗？如何用样本回归模型进行预测？问题结束了吗？ ?1 密度函数假定1：解释变量是非随机的。假定2: 零期望假定：E(ui) = 0。 E(ui|Xi) = 0。古典线性回归模型的基本假定 E(Y|Xi) = ?0 + ?1 Xi X Y 0 假定3：同方差性假定：Var(ui) = E[ui - E(ui) ]2 = E(ui2) = ? 2。 X Y 0 X Y 0 同方差异方差假定4：无序列相关（无自相关）假定： Cov(ui, uj) = E[(ui - E(ui) ) ( uj - E(uj) )] = E(uiuj) = 0, (i ? j )。无自相关正自相关负自相关假定5：ui服从正态分布, ui ~N(0,?2) 假定6*：解释变量X与随机误差项u不相关 Cov(ui, Xi) = E[(ui - E(ui) ) (Xi - E(Xi) )] = E(ui Xi) = 0 如果X为确定性变量，该假定自然满足假定7*：回归模型是关于参数线性的，但不一定关于变量线性。其他一些假定的说明： OLS估计量的性质高斯-马尔可夫定理如果满足古典线性回归模型的基本假定（假定1-假定4），则在所有的线性估计量中，OLS估计量是最优线性无偏估计量（BLUE）。线性性无偏性有效性都是Yi的线性函数。证明： = = = 令代入上式，得： = 线性性线性估计量的处理要比非线性估计量更为容易证明： = = = = = = 无偏性 =?1 ??1 无偏估计量有偏估计量 OLS估计量的方差比其他线性无偏估计量的方差都小。最小方差性与有效性 ?1 一致性（了解） ?1 概率密度 OLS估计量的方差为什么要估计方差？方差反映了数据的离散程度和估计结果的精确性。受教育年限与每小时工资 ?1 总体（随机误差项）真实方差?2的估计量： ?2的估计受教育年限与每小时工资 OLS