第二讲20130317.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲 OLS估计量与高斯-马尔科夫定理 基本概念:估计量与估计值 所谓估计量就是指估计总体参数的一种方法。在该方法下,给定一个样本,我们可以获得一个具体的估计结果,该结果就是所谓的估计值。例如,基于一个样本容量为N的样本,其中为第i次观测值,我们用样本均值来作为对总体均值的估计。在这里,就属于估计量,由于其取值随着样本的变化而变化,因此它是随机的。现在假设我们持有A、B两个样本:与,则基于这两个样本,可以计算出: 分别是估计量可能的取值,它们就是估计值。既然估计量是随机变量,那么它一定服从某种分布,由于估计量与抽样相联系,因此我们把估计量所服从的分布称为抽样分布。有关统计学的一些基本知识请参见本讲附录一。 笔记: 观测值是随机变量的一个可能的取值。我们用样本均值来估计总体均值,实际上就是用来估计。在数理统计中,这被称为矩估计,因为被称为样本(一阶)矩,而被称为总体(一阶)矩。矩估计其要点可以归结为,符号与符号E相对应。我们再来看看矩估计思想的一个应用。为了估计随机变量的方差E[- E()]2(也即总体方差),在矩估计法下,则方差估计量将是:。应该注意到,这个方差估计量是有偏估计,而才是方差的无偏估计。如果样本容量很大,这两个估计量相差无几,事实上两者都是方差的一致估计量。这个例子暗示,矩估计并不一定会获得一个无偏的估计量,但将获得一个一致的估计量。关于估计量无偏性与一致性的基本含义见附录1 高斯-马尔科夫假定 对于模型:,则、相应的OLS估计量就是: 在一些重要的假定下,OLS估计量表现出良好的性质。我们把这些假定称为高斯-马尔科夫假定。 ●假定一:真实模型是:。有三种情况属于对该假定的违背:(1)遗漏了相关的解释变量或者增加了无关的解释变量;(2)y与x间的关系是非线性的;(3)并不是常数。 笔记: 1、遗漏了的解释变量将进入误差项,从而这很可能导致误差项不在满足下面所列举的一些假定;如果真实模型是非线性的,但我们却用一条直线来近似它,显然这是南辕北辙;如果参数并不是常数,然而我们却基于特定样本用一些常数去近似它们,这显然也不合理的。 2、经济学理论或许很少直接认为y与x的关系是线性的,y与x具有非线性关系可能更符合现实。然而把模型建立成非线性形式常常会付出代价,因为非线性模型其待估计的参数可能更多,从而导致自由度的耗费,带来估计精度的下降。另外,从数学上讲,利用泰勒展开,我们也常常可以用一个线性模型去近似非线性模型。 ●假定二:对解释变量的N次观测即被预先固定下来,即不会随着样本的变化而发生变化,是一个非随机列向量。显然,如果解释变量含有随机的测量误差,那么该假定被违背。还存其他的违背该假定的情况。 笔记: 1、被假定不会随着样本的变化而发生变化,但这并不意味着在一个给定的样本中。事实上,在含有一个截距与一个解释变量的简单线性回归模型中,将意味着OLS估计是不可行的,见高斯-马尔科夫假定六。 2、被假定为非随机并不是一个标准假定,然而在该假定下数学处理要简单得多,而且OLS基本的涵义也并未丧失。是随机的情况更一般化,此时,高斯-马尔科夫假定二被更改为:对任意与,与不相关,此即所谓的解释变量具有严格外生性。显然,当非随机时,与必定不相关。事实上,假定二其最终目的在于保证与不相关。 3、在建立模型时,我们总是希望误差项是由一些不重要、没有任何信息价值的成分所构成。如果与相关,这意味着误差项还具有一定的信息价值,因此在某种程度上可以认为,我们预先建立的模型是不完备的。应该注意到,如果模型遗漏了解释变量,而这些被遗漏的解释变量又与已存在的解释变量是相关的,那么这将导致误差项与已存在的解释变量是相关的。 4、为了理解非随机性的假定,我们考虑如下一个例子。我们试图考察受教育年限(x)对收入(y)的影响。假定我们预先知道总体中有1%的人口接受了22年的学校教育;有3%的人口接受了19年的学校教育;有10%的人口接受了16年的学校教育…。现在,我们进行一个样本容量为1000的抽样调查。为了使样本尽量反映总体的情况,我们要求样本中有10人接受了22年的教育;有30人接受了19年的教育;有100人接受了16年的教育。这种抽样技术被称为分层随机抽样(Stratified random sample)。在抽样中,设定前10次观测对象是那些接受了22年的教育的人,接下来是那些接受了19年教育的人…。在这种方法下我们可以获得多个样本,但被预先固定下来,即它不会随着样本的变化而发生变化。 ●假定三:误差项期望值为0,即。 笔记: 1、当随机时,标准假定是: 根据迭代期望定律有:,因此,如果成立,必定有:。另外,根据迭代期望定律也有: 而。故有: 因此,在是随机的情况下,假定二、三可以修正为一个假定:

文档评论(0)

zilaiye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档