- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲 一元线性回归
美国某州对酒后驾车的司机实施了严厉的新处罚:这对高速公路上发生的死亡事故有什么影响呢?某学区缩小了小学班级的规模:这对学生的标准化测试成绩有什么影响呢?你成功地完成了又一年的大学课程,这对你将来的收入有什么影响呢? 本章介绍了联系一个变量X与另一个变量Y的线性回归模型。该模型假定X和Y之间具有线性关系;且联系X和Y的直线斜率表示X变化一个单位对Y的影响。正如Y的均值是Y总体分布的一个未知特性,联系X和Y的直线斜率是X和Y联合总体分布的一个未知特性。计量经济学的问题是利用这两个变量的样本数据估计这个斜率即估计X变化一个单位对Y的影响。 回到小班教育的问题:如果能够求出精确解:我们用TestScore表示标准化测试成绩,ClassSize表示班级规模。 再增加一个截距,我们就得到分数与班级规模的线性关系。 问题在于我们忽略了其他因素的影响。如何表示“其他因素”? 不同的课本定义有所不同 对于方程: 因此,这就不再是一个精确的确定性关系,而是一个非确定性关系。 确定性和非确定性关系的图形表示 其中ui是从样本点到直线的距离 随机误差项出现的原因 (1)回归模型中省略的变量。 (2)人的随机行为。 (3)建立的数学模型形式不够完善。 (4)经济变量之间的合并误差。 (5)测量误差等。 线性回归模型的系数估计 何为回归? 一般而言,父亲身高(矮),子女也身高(矮) 加尔顿(Galton)发现:矮个的父亲,如身高1.5M的人群,他们的子女的平均身高大于其父亲的平均身高,且趋向于(或回归于)所有人(高和矮)的平均身高。 对于高个的父亲,其子女的平均身高低于其父亲的平均身高,而且回归到所有人的子女的平均身高,即回归到中等身高。 1。对于模型 来说,由于干扰项的存在,我们只能随机选取若干样本点,此时,无法求出B0和B1的值。 2。我们需要找到一条“穿越”这些样本点的直线,来模拟Y与X的线形关系。这样的直线有无数条,每画一条直线,就会产生一组B0’和B1’的取值。 3。关键的问题是,如何找到一条最“完美” 的直线,使得这条直线对于样本点具有最强的解释力,如果能够确定这条直线, B0和B1就能够“估计”出来,这就是我们所需要的参数。在计量课本中一般用 表示。 参数估计 所有的样本点向直线引出垂线(样本点到直线的距离),最完美的直线一定是:所有样本点到直线的距离的平方和最小。 这就是我们通常所说的 “普通最小二乘法”,简称OLS。 OLS估计量的思想是: 1.假设估计出的方程直线为Y’i=b0+b1Xi 因而第i个样本点到直线的距离为: Yi - (b0+b1Xi)= Yi - b0 - b1Xi 故所有n个观测值的预测误差平方和为: 普通最小二乘法 求解步骤 * * 更为一般的情况: 被解释变量或者因变量 解释变量或者自变量 随机误差项、随机扰动项、随机项、误差项 回归系数、待定系数、待定参数 书上的例子:大体为弱负相关性 应该选取哪条直线? 我们只要求出它的最小值即可。 分子分母同除以n 使用时,直接删除本页! 精品课件,你值得拥有! 精品课件,你值得拥有! * * *
文档评论(0)