第五讲多元线性回归ppt.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲多元线性回归ppt.ppt

多元线性回归分析 在研究某个经济现象时,如果设定一个变量,该变量受其他因素的影响,该变量称为被解释变量。影响它的因素被称为解释变量。上一章我们讨论了仅有一个解释变量对被解释变量影响的例子。实际上,影响一个经济变量的因素可能会很多,因此,本章我们考虑具有多个解释变量的回归模型,即多元回归模型。 例一:研究某种进口商品的数量(或金额) 解释变量有哪些? 解释变量:进口商品价格(到岸价、国内市场价)、国产替代品价格、收入水平、汇率水平等。 例二:研究某城市房地产需求 解释变量有哪些? 解释变量:收入;资产;住房价格或指数;住房价格指数变化率;物价指数、通货膨胀和相关预期;利率等。 例三:研究劳动者收入差异 解释变量有哪些? 解释变量:性别,教育年限,工龄,行业,年龄,种族,职位,地区。 如果选取的解释变量太少,或者很多重要的解释变量没有考虑到,就会产生遗漏变量偏差问题。 遗漏变量偏差问题 第4章和第5章中的实证分析只集中在学生/教师比上,忽略了某些决定测试成绩的潜在重要因素,而仅仅将这些因素的影响纳入回归误差项中。这些遗漏因素包括教师质量、计算机使用率等学校特征和家庭背景等学生特征。 例如:由于加利福尼亚州有庞大的移民人口,因此我们首先考虑遗漏的且显著有关的学生特征,即学区内还在学习英语的学生人数的普遍性。 忽略学区内英语学习者的百分率可能使测试成绩对学生/教师比回归中斜率的OLS估计量有偏;也就是说,OLS估计量抽样分布的均值可能不等于学生/教师比变化一个单位对测试成绩的真正效应。 理由是:仍在学习英语的学生在标准化测试中的表现可能要比母语是英语的学生差。如果大班学区内有很多学生还要学习英语,那么有可能在测试成绩对学生/教师比的OLS回归中发现了错误的相关关系并得到了一个夸大的系数估计值,而事实上减小班级规模对测试成绩的真正因果效应很小甚至为零。 对加利福尼亚的数据进行测算: corr(学生/教师比,英语学习者百分率)=0.19。 这一虽小却为正的相关系数表明学区内的英语学习者越多则学生/教师比往往也越高(较大班级)。 若学生/教师比与英语学习者的百分率没有关系,则在测试成绩对学生/教师比回归中可以忽略英语学习者人数,但由于两者相关,因此在测试成绩对学生/教师比回归中的OLS系数有可能反映了这一影响,即斜率2.28包含了英语学习者因素的影响。 遗漏变量偏差的定义 若回归变量(学生/教师比)与回归中漏掉的并对因变量(测试成绩)起部分决定作用的某个变量(英语学习者百分率)相关,则OLS估计量有遗漏变量偏差。 (1)遗漏变量与回归中的回归变量相关; (2)遗漏变量是因变量的一个决定因素。 这两个条件都为真时,便会发生遗漏变量偏差。 三个例子 例1:英语学习者百分率。 条件1成立,条件2成立。是遗漏变量。 例2:测试的时间。 条件1不成立,条件2成立。不是遗漏变量。 例3:每个学生的停车空间。 条件1成立,条件2不成立。不是遗漏变量。 遗漏变量偏差的后果 经典假设1:随机误差项ui的数学期望为0。即:E(ui|Xi) = 0。 将失效。 一元线性回归模型中的误差项ui表示除Xi之外所有决定Yi的因素。若其中某个因素与Xi相关,则意味着误差项(包含了这个因素)与Xi相关。 即,若遗漏变量是Yi的一个决定因索,则它被包含在误差项中,如果它与Xi相关,则意味着误差项ui与Xi相关。 这就违反了第一个最小二乘假设,造成了严重的后果,即OLS估计量是有偏的。 结论 通过数据分组处理遗漏变量偏差 多元线性回归模型 多元线性回归模型:表现在线性回归模型中的解释变量有多个。 总体回归模型 总体回归方程(函数) 如何理解“控制住”某个变量 对于汽车数据,例如我们有如下方程: Price=14542+4.36*weight-104.8*length-86.7*mpg+ui 如何理解4.36? 假设(X1i,X2i,…Xki;Yi)i=1…n是总体的n次独立样本观测值。 习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。这样: 模型中解释变量的数目为(k+1) 普通最小二乘估计 对于随机抽取的n组观测值 几个重要的计算结果 X’X= 此处用到了矩阵的微商的概念: 假设A为n阶方阵 例题一 我国1988年---1998年的城镇居民人均全年耐用消费品支出Y(元)、人均全年可支配收入X1(元)、以及耐用消费品价格指数X2(元)如下表所示,试利用excel和stata建立多元线性回归模型。 Excel的几个矩阵函数 1。MINVERSE(矩阵区域) 返回数组矩阵的逆矩阵。 2。MMULT(矩阵1,矩阵2) 返回两数

文档评论(0)

过各自的生活 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档