- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会经济研究中的选择性样本问题探索
0.回顾:如何识别社会经济问题中的因果效应?
0.1一个现实的例子:去医院能够让人更健康吗?
组别 样本大小 平均健康水平 标准差 去过医院 7774 3.21 0.014 没去过医院 90049 3.93 0.003 数据来源:2005年NHIS(National Health Interview Survey)
□ △ 0.72,t 58.9
□ 去医院会使人的健康状况变差?
□ 接受医疗是一个二值变量Di 0,1 ,考虑Di对健康水平的影响,我们想象去了医院的人如果没有去医院、没有去医院的人如果去了医院将会发生什么?
潜在结果 1
故Yi的潜在结果可用线性组合表示 2
□ 可见,就是个体去医院对其健康状况的影响。
□ 3
0.2捕获因果效应的工具—回归分析工具
□观察 2 式,通常用回归分析识别因果效应: 4
是Y0i的随机部分,根据处理状态(Di取值),取期望值得到: (5)
于是: (6)
□选择性偏误意味着回归误差项与回归元Di之间相关。
1.什么是选择性问题(Selection Problem)
1.1 Effect of Education on Women`s Wages Sartori,2003 (7)
:妇女工资水平
:妇女教育水平
Problem:谁进入我们的样本?
在工作的妇女。而不是那些未找到工作的妇女。
而这些工作的妇女是不是还存在重要的没有被度量的变量,而这些变量恰恰与未找到工作的妇女存在显著差别。比如说:工作的妇女更加聪明?或者更加勤奋?或者情商更高?等等。
选择方程(selection equation): (8)
效用函数
:有可能影响妇女进入劳动力市场的因素向量。
:未被度量的因素,假定服从随机正态分布,同
是不可观察的,假如妇女根据这一效用函数做决策,进入劳动力市场或者不进入劳动力市场,我们给一个二元随机变量: (9)
选择性偏差 selection bias 来源:
(1)教育程度高的妇女更容易找到工作?不会引起方程(1)的偏差。
(2)教育程度低的一部分妇女更愿意进入劳动力市场,因为她们觉得就业更“划算”。这时候获得较好收入并不是因为她们受教育程度更高,而是由于一些“没有被度量的因素”。此时这些因素的存在使得方程的残差项变得更大。
1.2.Effect of GRE Scores on Graduate in Graduates school (10) (11)
结果方程: (12)
1.3.忽略变量偏差(Omitted Variable Bias)
□选择方程中的解释变量和结果方程中的解释变量不相关时,不存在选择性样本问题。Is this true in case2?
□影响选择方程的“所有”变量都被包含在结果方程中。Is this True?
□Case1 and Case2,选择方程的误差项和结果方程的误差项存在相关性时,结果方程的误差项不满足均值为0,且与解释变量相关。
1.4选择性样本问题的本质与类型
□非随机样本——自选择性。
□数据缺失——数据截断(Truncation Data)或.归并数据(Censored DATA);状态缺失。
数据搜集过程中基于因变量的截断:
归并数据(Censored DATA)
将解释变量在某个区间的样本观察值转化为一个值。
□内生性——残差项与解释变量相关。
□选择型样本数据
例如:研究家庭收入、家庭支出、家庭用于子女教育的支出。
1.5判断选择性样本问题——经验规则(2012李子奈)
第一、对于样本时微观截面个体数据,需要考虑选择性样本问题。对于样本是时间序列的数据,我们不需要考虑。
第二、如果样本包含截面的全部个体,则不考虑数据截断问题。样本是按照标准的抽样理论取得的则不需要考虑截断数据问题。如果不是,则需考虑数据截断问题。
第三、归并问题根据样本观察值的经济背景。
2.模型的处理——Heckman Model
2.1.Heckman Model
2.1 Basic Setup
□Selection equation (13)
□Outcome equation: (14) (15)
2.2Conditional Mean in the Heckman Model (16)
□相互独立,
□,
此时: (17)
□Conditional Mean in Heckman Model (18)
2.3Marginal Effects (19)
2.4Estimation
□Heckman`s Two-Step Procedure
第一步,根据选择方程(probit model)运用MLE得到估计值,计算IMR,和。
第二步,根据存在时的y值估计和(OLS)
□MLE Version
文档评论(0)