- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章_条件期望及现代观点下计量经济的汇
Chapter2 现代观点下计量经济的
基本理念和理论基础
§1 问题的提出
从数据谈起
模型、数据哪个是第一位的?传统观点是模型第一位,现代观点认为数据是第一位的。我们不应当假设数据满足模型的条件,而应当要求模型适应数据的特点,这是现代观点下计量经济的出发点。
a.如果手头有一些数据,,它能告诉你什么?什么也没有!因为
我们不知道数据来源背景,从而不知道数据所表达的含义。
b.如果该数据是某人历次考试成绩的记录,它能告诉你什么?可以认为,X
是某人的学习能力,称为总体(population),是学习能力的反映,它是取自总体X中的样本,可建立模型:,a是真值,是客观存在的能力,但不可观测。于是,就反映了该学生的学习能力水平,就反映了该生学习能力的稳定性。等等。
c.但是,如果该数据是某企业的股票价格,那么就没有理由认为是相互独立的,而是一个与时间有关联的序列,那么就有可能不再有一个稳定的极限,例如,随机游走。。则,,从而显得不可预测,这样的数据可以认为是没有用的,但在现在的随机过程理论和计算机技术下,我们仍能从中捕捉到“股票价值”X的某些信息。
这里,我们看到,经济中数据的来源是非常复杂的,有的可以看成是服从某一分布的随机变量,有的则是某一特定的随机过程,甚至是不平稳过程。
d、对于有相互关联的多组数据,,同样我们首先要知道数据的来源,知道有关的知识,这一点与传统观点是一致的。但传统观点的局限是,解释变量是确定性的,与误差项无关。而这种要求的数据一般只在实验室中才能做到,大量经济数据一般事前无法安排,并且解释变量之间也存在关联性,解释变量与误差项之间也有关联性,另外,数据是不可重复的。为此,现实经济要求我们把对数据的要求放宽。我们做如下的陈述:
假设:(1)我们关注的结果Y是一个随机变量(视为一个总体)。
(2)我们认为影响结果Y的原因是一个K维随机变量,。
(3)的联合分布存在,且存在期望和方差。
(4)可以从随机抽取观测样本(random sampling),或抽取受各种限制的观测样本。
提出的问题是,如果能从获取观测样本(信息),如何调整对的认识?即如何用来表达?
注:(1)的联合分布、期望、方差存在,并不意味着已知。
(2)的因果关系中,X的分量对Y的影响既有轻重之分,又有可观测和不可观测之分,甚至有半不可观测,即Y与X的因果关系可以按理论更加随意的设定。
例如,我们关注的是工资与教育的关系,但是影响工资的因素除了教育之外,根据劳动经济学的知识,还有工作经验和能力。其中,工作经验可用工作年限表示,又由于工作经验有正外部性,故可设计工作经验的平方作为另一个解释变量,而能力则是不可观测,如chapter1的例1,但仍可以放在因果关系中,不过需要有特殊的处理。
(3)因果关系不一定是线性关系,从平均意义或期望意义上讲,我们要关注的是条件期望,的直观含义是如果知道X,平均意义上看Y是什么?它包含比从全体平均意义上看Y是什么即有更多的信息。并且希望能把表达出来,建立一个模型,称为总体模型(population model)。
(4)随机抽取样本的最基本形式是截面数据(cross section data),含义是给定一个固定的时间点或是时间段上,解释变量与因变量的数据是从母体中随机发生的,而是实验数据(experimental data)的含义是实验者预先设定解释变量的实验值,然后观测因变量的结果值,传统观点下的样本设定为实验数据,与实验数据是分开的,指的是一切其他环境对结果的随机影响。
(5)随即样本的另外几种形式:
Pooled cross section data 在不同时间点样本独立,但不同分布(混同样本)。
Spatial correlation 在不同地区样本有相关性,不独立(空间相关性)。
Cluster sample 串样本,时间数据有分段特征(群集数据)。
Panel data 面板数据,数据有二元特征,特别是有时间特征,但时间不太长,有限。这些特殊样本的处理,特别是面板数据我们在后面的模型中专门分析、介绍。
§2 有关理论
下面着手建立解决上述问题的一套基本理论。假设是客观存在,但是未知或者部分未知,那么获取数据资料以后,从获取的数据和中就应当反映这种客观存在的关系,,。进一步,如果的函数关系也不清楚,那么找一个什么样的函数关系是合理的?合理性的准确含义又是什么?
着手解决两个问题:
1、合理性按均方误差标准,即选择g(X)使得其与Y的误差平方最小,,简记成MSE(mean square error)。
2、如果用线性关系,具备什么条件才能使满足条件1的,即使与等价。我们有如下的基本定理:
定理1:用条件期望来表达Y,则MSE最小,即:
, arg表示满足最小值条件的g(X)。
首先复习一下条件期
您可能关注的文档
最近下载
- QB∕T 5775-2022 离子交换树脂再生剂 氯化钠.pdf
- 24秋初中地理七年级上册(配湘教版)第二节 气温和降水 第1课时.pptx VIP
- 生命体征测量ppt(共69张PPT).ppt VIP
- 八年级地理第二章中国的自然环境第二节-气候第一课时..ppt
- 欧姆龙PLC-CP1E的中文手册.pdf VIP
- (正式版)D-L∕T 1870-2018 电力系统网源协调技术规范.docx VIP
- 八年级地理第二章中国的自然环境第二节_气候第一课时.ppt VIP
- 八年级语文上册第—次月考卷 1、3单元(江西专用)(原卷+解释)2025-2026学年 统编版.docx VIP
- 人教版八年级地理_第二章中国的自然环境第二节气候.ppt VIP
- 八年级上册地理第二章第二节中国的气候.pptx VIP
文档评论(0)