【2017年整理】简单线性回归模型.pptVIP

下载本文档

77
0
约5.47千字
约 68页
2017-06-11 发布于浙江
举报
版权申诉

【2017年整理】简单线性回归模型.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

【2017年整理】简单线性回归模型

第二章简单线性回归模型;说明;obsno;所谓横截面数据集，就是在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本所构成的数据集。有时，所有单位的数据并非完全对应于同一时间段。例如，几个家庭可能在一年中的不同星期被调查。在一个纯粹的横截面分析中，我们应该忽略数据搜集中细小的时间差别。如果一系列家庭都是在同一年度的不同星期被调查的，那我们仍视之为横截面数据集。;横截面数据的一个重要特征是，我们通常可以假定，它们是从样本背后的总体中通过随机抽样(random sampling)而得到的。例如，如果我们通过随机地从工人总体中抽取500人，并得到其有关工资、受教育程度、工作经历和其他特征方面的信息，那我们就得到所有工人构成的总体的一个随机样本。随机抽样是初级统计学教程中所讲授的抽样方案，而且它使得对横截面数据的分析大为简化。 ;有时，以随机抽样作为对横截面数据的一个假定并不适当。例如，假设我们对研究影响家庭财富积累的因素感兴趣，虽然我们可以调查家庭的一个随机样本，但有些家庭可能拒绝报告其财富。比方说，如果越是富裕的家庭就越不愿意暴露其财富，那么由此得到的财富样本，就不是由所有家庭构成的总体的一个随机样本。这是对样本选择问题的一个解释。;简单回归模型的定义 ;应用计量经济学分析大多都是从如下假设前提开始的：y和x是代表某一个总体的两个变量，我们感兴趣的是用x来解释y，或者说是研究y如何随x而变化。一些例子：y是大豆的产出，x是化肥的用量；y是每小时的工资，x是受教育的年数；y是社区的犯罪率，x是警察的数量，等等。;简单回归模型的定义;简单回归模型的定义; 在简单线性回归模型y = b0 + b1x + u中，统称y为：因变量（Dependent Variable）或响应变量(response variable)或被解释变量（Explained Variable）或被预测变量(predicted variable)或回归子(regressand) ;几个术语;说明： “自变”(independent)与统计学概念里面随机变量之间的独立(independency)有所不同。;y;几个术语;误差项或随机扰动项的来源：被忽略的因素测量误差随机误差模型的设定误差 ;等式y = b0 + b1x + u同样表述了y和x之间的函数关系。如果u中的其他因素被看作是保持不变的，就意味着u的变化为零，即，那么x对y具有线性影响，其表述如下：如果，那么 ……(2.2) ;(2.2)意味着y的变化量是 b1和x的变化量的简单乘积。这就是说，保持u中其他因素不变， b1就是y和x的关系式中的斜率参数(slope parameter)，在应用经济学中，它是人们研究的主要兴趣所在。截距参数(intercept parameter) b0 也有它的作用，但很少被当作分析研究的主要部分。;例2.1 大豆产出和施肥量假使大豆的产出由以下模型所决定： (2.3) y=产出而x=施肥量。农业研究者对其他因素不变时化肥用量如何影响大豆产出量感兴趣。影响的效果由b1 给出，误差项u包括了诸如土地质量、降雨量等因素。系数 b0度量了在其他条件不变的情况下施肥量对产出量的影响：;例2.2 一个简单的工资方程以下模型表示一个人的工资水平与他的可测教育水平及其他非观测因素的关系： (2.4) 如果工资和教育分别以每小时美元数和受教育的年数来计量，那么b1度量了在其他条件不变的情况下每增加一年教育所获得的小时工资增长量。其他非观测因素则包括劳动力的经验、天生的素质、在现任雇主之下供职的时间、工作道德以及无数的其他因素。;等式(2.1)的线性性显示：不管x的初始值为多少，它的任何一单位变化对y的影响都是相同的。这对许多经济学应用来说是非常不现实的。例如：在工资—教育的例子中，我们或许还要考虑到递增的回报，就是说：后一年的教育比前一年的教育对工资的影响更大。后面我们会研究如何考虑这种可能性。;最困难的问题;只有当我们对非观测的u与解释变量x之间的关系加以约束时，才能从一些数据的随机样本中获得b0和b1的可靠估计量。没有这样一个约束，我们就不能估计出在其他条件不变下的影响b1。因为u和x都是随机变量，所以我们需要一个基于概率的概念。 ;一个简单的假设;在例2.1中，我们把诸如土地质量这