- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Heckman两阶段模型模型Heckman两阶段IMR逆米尔斯比率InverseMillsRatioSPSSAU
Heckman两阶段模型
Contents
1背景2
2理论3
3操作3
4SPSSAU输出结果4
5文字分析5
6剖析7
7疑难解惑8
在某些情况下,被解释变量Y的取值范围会受到限制,比如研究家庭医疗保险支出的影响
因素时,某此家庭没有医疗支出即数字全部为0,也或者研究家庭收入水平时,某些样本家庭
完全没有收入那么收入就全部为0,也或者数据调查中有一项为收入为10万以上,那么10万
以上的具体数据就‘截尾’(没有10万以上,最多就到10万),又比如研究存款的影响因素,但
是有的样本存储为负数(即其为负债非存储),诸如此类,按常理应该是正常的正态数据,但是
其被解释变量出现‘断层’(删失),均可使用Heckman两阶段模型进行研究(而不是常用的ols
线性回归)。
Heckman两阶段模型案例
Contents
1背景2
2理论3
3操作3
4SPSSAU输出结果4
5文字分析5
6剖析7
7疑难解惑8
1背景
当前有一项关于薪资影响因素的研究,被解释变量薪资,解释变量为GRE成绩,但是会出
现一个问题即薪资中有很多缺失数据(即样本偏差内生性问题),一种处理方式是直接过滤掉缺
失数据进行分析,但这种分析方式仅仅是避开样本选择偏差内生性问题,如果要直面此种样本
选择偏差内生性问题,则可考虑使用Heckman两阶段模型。除此之外,GPA成绩可能会影响到
‘是否有薪资’数据,其可作为‘是否有薪资数据’的解释变量。为更加方便的查看被解释变量薪资
的数据分布情况,将薪资作直方图如下:
从上图可以明显的看到,数字出现删失,即有一部分数据集中在数字0(数字0代表没有
薪资数据,当然也可以使用null值表示,只是heckman两阶段模型时需要使用数字0表示没有
该数据)。当然在分析的时候可考虑筛选出数字大于0的数据再进行ols线性回归也可(但这样
做仅仅是避开样本选择偏差可能的内生性问题),如果说筛选出薪资大于0后再做直方图如下:
明显的可以看到,筛选出薪资大于0的数据,其明显的服从正态分布,使用ols线性回归
非常适合。但本案例使用heckman两阶段模型目的在于解决样本选择偏差导致样本的内生性问
题。
2理论
Heckman两阶段模型时,被解释变量(因变量)Y有着缺失数据,通常首先需要将被解释
变量设置为0和1,0代表删失(即没有该项数据),1代表未删失(即有该项数据),得到新的
变量,比如本案例为‘薪资(0代表无1代表有)’,其共分为两个阶段,说明如下:
✓第1阶段:二元probit回归模型;即将薪资(且为01项二元数据)作为被解释变量,并
且纳入解释变量(一般情况下,解释变量为核心研究解释变量与工具变量),进行二元
probit模型后,得到IMR值(InverseMillsRatio)。
✓第2阶段:ols回归模型,将‘薪资’作为被解释变量,并且模型会自动纳入第1阶段得
到的IMR值,以及研究的核心解释变量进行分析,并且在第2阶段分析时,会自动过
滤出‘未删失’即薪资没有缺失的数据,并且得到结果。
✓针对分析上:如果IMR值呈现出显著性(p0.05),即意味着存在样本偏差内生性问
题,也即说明有必要使用Heckman两阶段模型进行分析,反之如果IMR值没有呈现
出显著性(p0.05),即意味着样本偏差内生性问题不严重(或不存在),此时可考虑使
用Heckman两阶段模型(或者ols回归均可)。
✓另heckman两阶段模型分析上依旧是针对解释变量的显著性进行分析即可,并
您可能关注的文档
- SPSSAU__调节作用深入分析2.pdf
- SPSSAU__调研类报告撰写.pdf
- SPSSAU__多个卡方值计算.pdf
- SPSSAU__多选题数据格式.pdf
- SPSSAU__二元logit原理剖析.pdf
- SPSSAU__分析结果报告.pdf
- SPSSAU__交互作用深度剖析.pdf
- SPSSAU__结构方程模型SEM分析.pdf
- SPSSAU__两种数据分析格式.pdf
- SPSSAU__面板数据熵值法.pdf
- 中考语文总复习语文知识及应用专题5仿写修辞含句子理解市赛课公开课一等奖省课获奖课件.pptx
- 湖南文艺版(2024)新教材一年级音乐下册第二课《藏猫猫》精品课件.pptx
- 湖南文艺版(2024)新教材一年级音乐下册第三课《我向国旗敬个礼》精品课件.pptx
- 高中生物第四章生物的变异本章知识体系构建全国公开课一等奖百校联赛微课赛课特等奖课件.pptx
- 整数指数幂市公开课一等奖省赛课微课金奖课件.pptx
- 一年级音乐上册第二单元你早全国公开课一等奖百校联赛微课赛课特等奖课件.pptx
- 八年级数学上册第二章实数27二次根式第四课时习题省公开课一等奖新课获奖课件.pptx
- 九年级物理全册11简单电路习题全国公开课一等奖百校联赛微课赛课特等奖课件.pptx
- 八年级语文下册第五单元19邹忌讽齐王纳谏省公开课一等奖新课获奖课件.pptx
- 2024年秋季新人教PEP版3年级上册英语全册教学课件 (2).pptx
文档评论(0)