第三讲一元线性回归2讲述.ppt

下载文档 降价啦

2
0
约4.3千字
约 52页
2017-08-25 发布于福建
举报
版权申诉
保障服务

第三讲一元线性回归2讲述.ppt

1、本文档共52页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一元线性回归（二）例题4-1 某城镇1988---1998年人均可支配收入X（元，1980年不变价），人均鲜蛋需求量Y（公斤），建立模型 Y=a+bX，估计收入对需求的影响。 1。利用Excel完成 2。利用stata完成先画散点图，然后估计方程。测试成绩和学生/教师比关系的OLS估计值及其分析。打开数据文件：score.dta reg testscr str 回归结果的分析 1。截距项和斜率的含义是什么？本题的截距表示：学生教师比为0（没有学生时）的测试成绩的最高值，因此没有实际意义。可以理解为确定回归线的系数。斜率：表示弹性 -2.28的斜率表示当每个教师对应的学生人数增加1个时，学区测试成绩将平均下降2.28分。而当每个教师对应的学生人数减少2个时，测试成绩平均提高： ((-2)×(-2.28))= 4. 56分，负的斜率表明每个教师对应的学生人数越多(较大规模的班)，则相应的测试成绩越差。 2。方程的经济预测能力：得到回归结果后，可以进行简单的预测，只要给定学生/教师比（X）取值后就能预测全学区的测试成绩了。 testscr=698.93 - 2.28×str + u 如每个教师对应20个学生的学区，其测试成绩预测值为698. 93-2.28×20=653.30。当然，由于其他决定学区成绩的因素（u）的影响，预测不会是绝对正确的。预测的准确程度取决于模型的优劣。 3。方程的斜率的大小评估：观察选取的420个样本的总体分布（分位数）一个例子：假设某个学区处于加利福尼亚学区的中位数，对应的学生/教师比为19. 7，现在想减少到17.7。一方面：她的学区学生/教师比从50%分位数移到接近10%分位数。这是一个相当大的变动。另一方面：带入方程，测试成绩预计从654.5提高到659.1，从50%分位数移到将近60%分位数。我们把利用OLS方法估计出的参数b0和b1称为OLS估计量，用表示。用OLS方法估计出的方程：残差的概念残差是每个样本的拟合值和实际值之间的差。用ei或者表示。样本回归模型：样本拟合线：残差值：基本原理： 1。确定样本个数n，给出观测值(Xi，Yi)， i=1,2,3,…n。由于样本容量已定，样本回归模型可写为：其中称为回归系数(拟合参数)，称为残差（拟合误差）。 2。利用OLS法寻找残差的平方和最小的直线，估计出的具体值。 3。此时可得到利用OLS方法测算出的Y的拟合值，注意，并不是实际的Y值，有如下计算公式：思考：与ui是否是一回事？有什么区别和联系？拟合优度拟合优度R2：描述OLS回归线对样本数据的拟合效果；描述观测值在回归线附近的离散程度；同时描述了样本数据有多大程度可以被回归方程所解释。回归R2是指可由Xi解释(或预测)的Yi样本方差的比例。 OLS方法得到的拟合线一定是所有直线中拟合效果最好的，但由于样本自身的原因，拟合效果有好有坏。最典型的例子是错误的函数形式拟合优度由于每次向回归方程中增加解释变量，R2必然只增不减。为此，可以通过调整自由度对解释变量过多进行“惩罚”，因此，可以定义 “校正的拟合优度” 察看上述例题的拟合优度注意： 1。拟合优度一定程度上反映了选取变量的对被解释变量的“解释能力”。 2。拟合优度低一般说明方程忽略了某些重要的解释因素。 3。在大样本下，拟合优度一般不会太高。回归标准误差（SER）回归标准误差(standard error of the regression. SER)是回归误差u的标准差估计量，是用因变量单位度量的观测值在回归线附近的离散程度。对于误差项ui，我们更关心它在回归线附近的离散程度，即标准差。希望标准差越小越好。由于ui本身是不可知的，因此，实际上sui是无法获得的，为了模拟其数值大小，我们用的标准差作为ui的标准差的估计值，称为回归的标准误差。模型中样本值可以自由变动的个数，称为自由度。自由度 = 样本个数 — 样本数据受约束条件（方程）的个数。例如，样本数据个数为n，它们受k个方程的约束（系数矩阵秩为k），那么，自由度df = n-k。其中n-2为自由度。由于随机变量必须满足k+1个正规方程（一元线形回归模型中有2个方程），故只有n-k-1个是相互独立的。经过这样校正后，才是无偏估计。如果无任何特征和规律可言，整个计量模型的建立将无法开展，因此，我们需要人为地为它设定一些假定条件。如果下列假定条

您可能关注的文档

文档评论（0）

00625 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第三讲一元线性回归2讲述.ppt