第2章一元线性回归模型教程方案.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量经济学 第 2 章 一元线性回归模型 也就是说,当父母双亲都异常高或异常矮,则子女的身高有趋向于人口总体平均身高的趋势。这种现象被称为高尔顿普遍回归定律。这就是回归一词的原始含义。 在现代,回归一词已演变为一种新的概念。回归分析就是研究被解释变量对解释变量的依赖关系,其目的就是通过解释变量的已知或设定值,去估计或预测被解释变量的总体均值。在下面的几个例子中,我们可以清晰地看到回归分析的实际意义。 1.高尔顿普遍回归定律。高尔顿的目的在于发现为什么人口的身高分布有一种稳定性。在现代,我们并不关心这种解释,我们关心的是:在给定父辈身高的情形下,找到儿辈平均身高的变化规律。 就是说,我们如果知道了父辈的身高,就可预测儿辈的平均身高。假设我们得到了一组父亲、儿子身高的数据,制成如下的散点图。图中按统计分组的方法将父亲身高分为若干组。 2.在经济学中,经济学家要研究个人消费支出与个人可支配收入的依赖关系。这种分析有助于估计边际消费倾向,就是可支配收入每增加一元引起消费支出的平均变化。 4.农业工作需要预计粮食产量,需要研究粮食产量与播种面积、施肥量、降雨量之间的依赖关系。 这种一个变量依赖于另一个或多个变量的事例在经济系统中普遍存在。回归分析就是要研究这种变量之间的依存关系。 二、统计关系与确定性关系 经济变量间的相互关系分为: ◆确定性的函数关系 Y f X ◆不确定性的统计关系—相关关系 Y f(X)+u u为随机变量 在经济系统中, 这种变量之间的函数关系或确定性关系就很少见 。常见的是变量之间是一种不确定的关系,既使变量X 是变量Y 的原因, 给定变量X 的值也不能具体确定变量Y的值, 而只能确定变量Y 的统计特征,通常称变量X 与Y 之间的这种关系为统计关系。 而在回归分析中,我们的主要目的在于根据其它变量的给定值来估计或预测某一变量的平均值。例如,我们想知道能否从一个学生的数学成绩去预测他的统计学平均成绩。 在回归分析中,被解释变量Y 被当作是随机变量,而解释变量X 则被看作非随机变量。而在相关分析中,我们把两个变量都看作是随机变量。 第二节 一元线性回归模型 在进入正式的回归理论之前,先斟酌一下变量y与变量x可以互换的不同名称、术语。 我们研究每月家庭消费支出Y 与每月可支配收入X 的关系。就是说,已知家庭每月可支配收入,要预测家庭每月消费支出的总体平均水平。为此,将80户家庭分为10组。表2.1给出了人为数据。 表2.1给出了以X 的给定值为条件的Y 的条件分布。 对于Y 的每一条件分布,我们能计算出它的条件期望,记为E(Y/X Xi),即在X取特定Xi 值时Y 的期望值。例如,X 1000时,Y 的期望值为: 总体回归线就是当解释变量取给定值时,被解释变量的条件均值或期望值的轨迹。 图2.2表明,对每一Xi 都有Y 值的一个总体和一个相应的均值。而回归线是穿过这些条件均值的线。 式(2.1)就是总体回归函数,简称总体回归。它表明在给定Xi 下Y 的分布的总体均值与Xi有函数关系,就是说它给出了Y 的均值是怎样随X 值的变化而变化的。 函数f Xi 采取什么函数形式,是一个需要解决的重要问题。在实际经济系统中,我们不会得到总体的全部数据,因而就无法据已知数据确定总体回归函数的函数形式。同时,对总体回归函数的形式只能据经济理论与经验去推断。 按这种解释 就不是线性的,因为 对 的一阶导数不是常数。 此时, 就是线性回归函数。 但 则不是线性回归函数,而是非线性回归函数。 在本课中,主要考虑的是对参数为线性的回归模型,线性回归是指对参数β为线性的一种回归(即参数只以它的1次方出现);对解释变量X则可以不是线性的。 四、总体回归函数的随机设定 从图2.2可清楚地看到,随着家庭收入Xi的增加,家庭平均消费支出E Y/Xi 也在增加,这表明了Xi与Y的平均水平的关系。我们想知道对于具体家庭而言,消费支出Y与它的收入水平Xi的关系。 从图2.2可以看到,给定收入水平Xi 的个别家庭的消费支出处于在该收入水平的家庭平均消费支出左右,也就是围绕着它的条件均值。我们把个别的Yi 围绕它的期望值的离差表示如下: 假设 对 Xi 为线性的,则: 2.数据的欠缺。 即使能确定某些变量对Y 有显著影响,但由于不能得到这些变量的数据信息而不能引入该变量。例如,从经济理论分析,家庭财富量是影响家庭消费的重要因素,应该引入该变量作为解释变量。但是,通常我们得不到有关家庭财富的信息。因此,我们只得把这个很重要的解释变量舍弃掉。 5.节省原则,我们想保持一个尽可能简单的回归模型。 如果我们能用两个或三个变量就基本上解释了Y 的行为,就没有必要引进更多的变量。让ui 代表所有其它变量是一种很好的选择。 六、样本回归函数 在实际回

文档评论(0)

a336661148 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档