第二章_条件期望及现代观点下计量经济的汇.docVIP

下载本文档

2
0
约6.37千字
约 13页
2018-04-30 发布于浙江
举报
版权申诉

第二章_条件期望及现代观点下计量经济的汇.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二章_条件期望及现代观点下计量经济的汇

Chapter2 现代观点下计量经济的基本理念和理论基础 §1 问题的提出从数据谈起模型、数据哪个是第一位的？传统观点是模型第一位，现代观点认为数据是第一位的。我们不应当假设数据满足模型的条件，而应当要求模型适应数据的特点，这是现代观点下计量经济的出发点。 a.如果手头有一些数据，，它能告诉你什么？什么也没有！因为我们不知道数据来源背景，从而不知道数据所表达的含义。 b.如果该数据是某人历次考试成绩的记录，它能告诉你什么？可以认为，X 是某人的学习能力，称为总体（population），是学习能力的反映，它是取自总体X中的样本，可建立模型：，a是真值，是客观存在的能力，但不可观测。于是，就反映了该学生的学习能力水平，就反映了该生学习能力的稳定性。等等。 c.但是，如果该数据是某企业的股票价格，那么就没有理由认为是相互独立的，而是一个与时间有关联的序列，那么就有可能不再有一个稳定的极限，例如，随机游走。。则，，从而显得不可预测，这样的数据可以认为是没有用的，但在现在的随机过程理论和计算机技术下，我们仍能从中捕捉到“股票价值”X的某些信息。这里，我们看到，经济中数据的来源是非常复杂的，有的可以看成是服从某一分布的随机变量，有的则是某一特定的随机过程，甚至是不平稳过程。 d、对于有相互关联的多组数据，，同样我们首先要知道数据的来源，知道有关的知识，这一点与传统观点是一致的。但传统观点的局限是，解释变量是确定性的，与误差项无关。而这种要求的数据一般只在实验室中才能做到，大量经济数据一般事前无法安排，并且解释变量之间也存在关联性，解释变量与误差项之间也有关联性，另外，数据是不可重复的。为此，现实经济要求我们把对数据的要求放宽。我们做如下的陈述：假设：（1）我们关注的结果Y是一个随机变量（视为一个总体）。（2）我们认为影响结果Y的原因是一个K维随机变量，。（3）的联合分布存在，且存在期望和方差。（4）可以从随机抽取观测样本（random sampling），或抽取受各种限制的观测样本。提出的问题是，如果能从获取观测样本（信息），如何调整对的认识？即如何用来表达？注：（1）的联合分布、期望、方差存在，并不意味着已知。（2）的因果关系中，X的分量对Y的影响既有轻重之分，又有可观测和不可观测之分，甚至有半不可观测，即Y与X的因果关系可以按理论更加随意的设定。例如，我们关注的是工资与教育的关系，但是影响工资的因素除了教育之外，根据劳动经济学的知识，还有工作经验和能力。其中，工作经验可用工作年限表示，又由于工作经验有正外部性，故可设计工作经验的平方作为另一个解释变量，而能力则是不可观测，如chapter1的例1，但仍可以放在因果关系中，不过需要有特殊的处理。（3）因果关系不一定是线性关系，从平均意义或期望意义上讲，我们要关注的是条件期望，的直观含义是如果知道X，平均意义上看Y是什么？它包含比从全体平均意义上看Y是什么即有更多的信息。并且希望能把表达出来，建立一个模型，称为总体模型（population model）。（4）随机抽取样本的最基本形式是截面数据（cross section data），含义是给定一个固定的时间点或是时间段上，解释变量与因变量的数据是从母体中随机发生的，而是实验数据（experimental data）的含义是实验者预先设定解释变量的实验值，然后观测因变量的结果值，传统观点下的样本设定为实验数据，与实验数据是分开的，指的是一切其他环境对结果的随机影响。（5）随即样本的另外几种形式： Pooled cross section data 在不同时间点样本独立，但不同分布（混同样本）。 Spatial correlation 在不同地区样本有相关性，不独立（空间相关性）。 Cluster sample 串样本，时间数据有分段特征（群集数据）。 Panel data 面板数据，数据有二元特征，特别是有时间特征，但时间不太长，有限。这些特殊样本的处理，特别是面板数据我们在后面的模型中专门分析、介绍。 §2 有关理论下面着手建立解决上述问题的一套基本理论。假设是客观存在，但是未知或者部分未知，那么获取数据资料以后，从获取的数据和中就应当反映这种客观存在的关系，，。进一步，如果的函数关系也不清楚，那么找一个什么样的函数关系是合理的？合理性的准确含义又是什么？着手解决两个问题： 1、合理性按均方误差标准，即选择g(X)使得其与Y的误差平方最小，，简记成MSE(mean square error)。 2、如果用线性关系，具备什么条件才能使满足条件1的，即使与等价。我们有如下的基本定理：定理1：用条件期望来表达Y，则MSE最小，即：， arg表示满足最小值条件的g(X)。首先复习一下条件期