网站大量收购独家精品文档,联系QQ:2885784924

第三讲 一元线性回归2讲述.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一元线性回归(二) 例题4-1 某城镇1988---1998年人均可支配收入X(元,1980年不变价),人均鲜蛋需求量Y(公斤),建立模型 Y=a+bX,估计收入对需求的影响。 1。利用Excel完成 2。利用stata完成 先画散点图,然后估计方程。 测试成绩和学生/教师比关系的OLS估计值及其分析。 打开数据文件:score.dta reg testscr str 回归结果的分析 1。截距项和斜率的含义是什么? 本题的截距表示:学生教师比为0(没有学生时)的测试成绩的最高值,因此没有实际意义。可以理解为确定回归线的系数。 斜率:表示弹性 -2.28的斜率表示当每个教师对应的学生人数增加1个时,学区测试成绩将平均下降2.28分。 而当每个教师对应的学生人数减少2个时,测试成绩平均提高: ((-2)×(-2.28))= 4. 56分, 负的斜率表明每个教师对应的学生人数越多(较大规模的班),则相应的测试成绩越差。 2。方程的经济预测能力: 得到回归结果后,可以进行简单的预测,只要给定学生/教师比(X)取值后就能预测全学区的测试成绩了。 testscr=698.93 - 2.28×str + u 如每个教师对应20个学生的学区,其测试成绩预测值为698. 93-2.28×20=653.30。当然,由于其他决定学区成绩的因素(u)的影响,预测不会是绝对正确的。预测的准确程度取决于模型的优劣。 3。方程的斜率的大小评估: 观察选取的420个样本的总体分布(分位数) 一个例子: 假设某个学区处于加利福尼亚学区的中位数,对应的学生/教师比为19. 7,现在想减少到17.7。 一方面:她的学区学生/教师比从50%分位数移到接近10%分位数。这是一个相当大的变动。 另一方面:带入方程,测试成绩预计从654.5提高到659.1,从50%分位数移到将近60%分位数。 我们把利用OLS方法估计出的参数b0和b1称为OLS估计量,用 表示。 用OLS方法估计出的方程: 残差的概念 残差是每个样本的拟合值和实际值之间的差。用ei或者 表示。 样本回归模型: 样本拟合线: 残差值: 基本原理: 1。确定样本个数n,给出观测值(Xi,Yi), i=1,2,3,…n。由于样本容量已定,样本回归 模型可写为: 其中 称为回归系数(拟合参数), 称为 残差 (拟合误差)。 2。利用OLS法寻找残差的平方和最小的直线,估计出 的具体值。 3。此时可得到利用OLS方法测算出的Y的拟合值 ,注意, 并不是实际的Y值,有如下计算公式: 思考: 与ui是否是一回事? 有什么区别和联系? 拟合优度 拟合优度R2:描述OLS回归线对样本数据的拟合效果;描述观测值在回归线附近的离散程度;同时描述了样本数据有多大程度可以被回归方程所解释。 回归R2是指可由Xi解释(或预测)的Yi样本方差的比例。 OLS方法得到的拟合线一定是所有直线中拟合效果最好的,但由于样本自身的原因,拟合效果有好有坏。 最典型的例子是错误的函数形式 拟合优度 由于每次向回归方程中增加解释变量,R2必然只增不减。为此,可以通过调整自由度对解释变量过多进行“惩罚”,因此,可以定义 “校正的拟合优度” 察看上述例题的拟合优度 注意: 1。拟合优度一定程度上反映了选取变量的对被解释变量的“解释能力”。 2。拟合优度低一般说明方程忽略了某些重要的解释因素。 3。在大样本下,拟合优度一般不会太高。 回归标准误差(SER) 回归标准误差(standard error of the regression. SER)是回归误差u的标准差估计量,是用因变量单位度量的观测值在回归线附近的离散程度。 对于误差项ui,我们更关心它在回归线附近的离散程度,即标准差。希望标准差越小越好。 由于ui本身是不可知的,因此,实际上sui是无法获得的,为了模拟其数值大小,我们用 的标准差作为ui的标准差的估计值,称为回归的标准误差。 模型中样本值可以自由变动的个数,称为自由度。 自由度 = 样本个数 — 样本数据受约束条件(方程)的个数。 例如,样本数据个数为n,它们受k个方程的约束(系数矩阵秩为k),那么,自由度df = n-k。 其中n-2为自由度。由于随机变量 必须满足k+1个正规方程(一元线形回归模型中有2个方程),故只有n-k-1个是相互独立的。经过这样校正后,才是无偏估计。 如果 无任何特征和规律可言,整个计量模型的建立将无法开展,因此,我们需要人为地为它设定一些假定条件。 如果下列假定条

文档评论(0)

00625 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档