第二讲20130317.docVIP

下载本文档

6
0
约8.1千字
约 28页
2016-12-31 发布于重庆
举报
版权申诉

第二讲20130317.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二讲 OLS估计量与高斯-马尔科夫定理基本概念：估计量与估计值所谓估计量就是指估计总体参数的一种方法。在该方法下，给定一个样本，我们可以获得一个具体的估计结果，该结果就是所谓的估计值。例如，基于一个样本容量为N的样本，其中为第i次观测值，我们用样本均值来作为对总体均值的估计。在这里，就属于估计量，由于其取值随着样本的变化而变化，因此它是随机的。现在假设我们持有A、B两个样本：与，则基于这两个样本，可以计算出：分别是估计量可能的取值，它们就是估计值。既然估计量是随机变量，那么它一定服从某种分布，由于估计量与抽样相联系，因此我们把估计量所服从的分布称为抽样分布。有关统计学的一些基本知识请参见本讲附录一。笔记：观测值是随机变量的一个可能的取值。我们用样本均值来估计总体均值，实际上就是用来估计。在数理统计中，这被称为矩估计，因为被称为样本（一阶）矩，而被称为总体（一阶）矩。矩估计其要点可以归结为，符号与符号E相对应。我们再来看看矩估计思想的一个应用。为了估计随机变量的方差E[- E()]2（也即总体方差），在矩估计法下，则方差估计量将是：。应该注意到，这个方差估计量是有偏估计，而才是方差的无偏估计。如果样本容量很大，这两个估计量相差无几，事实上两者都是方差的一致估计量。这个例子暗示，矩估计并不一定会获得一个无偏的估计量，但将获得一个一致的估计量。关于估计量无偏性与一致性的基本含义见附录1 高斯-马尔科夫假定对于模型：，则、相应的OLS估计量就是：在一些重要的假定下，OLS估计量表现出良好的性质。我们把这些假定称为高斯-马尔科夫假定。 ●假定一：真实模型是：。有三种情况属于对该假定的违背：（1）遗漏了相关的解释变量或者增加了无关的解释变量；（2）y与x间的关系是非线性的；（3）并不是常数。笔记： 1、遗漏了的解释变量将进入误差项，从而这很可能导致误差项不在满足下面所列举的一些假定；如果真实模型是非线性的，但我们却用一条直线来近似它，显然这是南辕北辙；如果参数并不是常数，然而我们却基于特定样本用一些常数去近似它们，这显然也不合理的。 2、经济学理论或许很少直接认为y与x的关系是线性的，y与x具有非线性关系可能更符合现实。然而把模型建立成非线性形式常常会付出代价，因为非线性模型其待估计的参数可能更多，从而导致自由度的耗费，带来估计精度的下降。另外，从数学上讲，利用泰勒展开，我们也常常可以用一个线性模型去近似非线性模型。 ●假定二：对解释变量的N次观测即被预先固定下来，即不会随着样本的变化而发生变化，是一个非随机列向量。显然，如果解释变量含有随机的测量误差，那么该假定被违背。还存其他的违背该假定的情况。笔记： 1、被假定不会随着样本的变化而发生变化，但这并不意味着在一个给定的样本中。事实上，在含有一个截距与一个解释变量的简单线性回归模型中，将意味着OLS估计是不可行的，见高斯-马尔科夫假定六。 2、被假定为非随机并不是一个标准假定，然而在该假定下数学处理要简单得多，而且OLS基本的涵义也并未丧失。是随机的情况更一般化，此时，高斯-马尔科夫假定二被更改为：对任意与，与不相关，此即所谓的解释变量具有严格外生性。显然，当非随机时，与必定不相关。事实上，假定二其最终目的在于保证与不相关。 3、在建立模型时，我们总是希望误差项是由一些不重要、没有任何信息价值的成分所构成。如果与相关，这意味着误差项还具有一定的信息价值，因此在某种程度上可以认为，我们预先建立的模型是不完备的。应该注意到，如果模型遗漏了解释变量，而这些被遗漏的解释变量又与已存在的解释变量是相关的，那么这将导致误差项与已存在的解释变量是相关的。 4、为了理解非随机性的假定，我们考虑如下一个例子。我们试图考察受教育年限（x）对收入（y）的影响。假定我们预先知道总体中有1%的人口接受了22年的学校教育；有3%的人口接受了19年的学校教育；有10%的人口接受了16年的学校教育…。现在，我们进行一个样本容量为1000的抽样调查。为了使样本尽量反映总体的情况，我们要求样本中有10人接受了22年的教育；有30人接受了19年的教育；有100人接受了16年的教育。这种抽样技术被称为分层随机抽样（Stratified random sample）。在抽样中，设定前10次观测对象是那些接受了22年的教育的人，接下来是那些接受了19年教育的人…。在这种方法下我们可以获得多个样本，但被预先固定下来，即它不会随着样本的变化而发生变化。 ●假定三：误差项期望值为0，即。笔记： 1、当随机时，标准假定是：根据迭代期望定律有：,因此，如果成立，必定有：。另外，根据迭代期望定律也有：而。故有：因此，在是随机的情况下，假定二、三可以修正为一个假定：