C17 受限因变量模型及样本选择纠正.docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第17章 受限因变量模型和样本选择纠正 摘要: C7中的线性概率模型是受限因变量(limited dependent variable (LDV))模型的一例子,其容易解释,但有其缺陷,本章介绍的logit模型和probit模型更为常用,但解释相对困难。实际应用中,离散和连续是相对的,也就是说,实际离散的经济变量可能也适用于因变量离散的模型建模。本节介绍的模型包括Tobit模型,用于应对角点解响应(corner solution response);泊松回归模型(计数模型),用于建模LDV只能取非负整数的情况;截断数据模型和对样本选择的纠正。 受限因变量模型更容易在横截面数据中被使用。样本选择的纠正通常都源于横截面或面板数据。 17.1 二值响应的logit模型和probit模型 线性概率模型的缺陷?二值响应模型(binary response model)关注的核心问题是响应概率(response probability): Py=1x=P(y=1|x1,x2,…,xn). logit模型和probit模型的设定 为此,需要先建一个连接函数: Py=1x=Gβ0+β1x1+β2x2+…+βkxk=G(β0+xβ), 其中G(.)是一个取值于(0,1)的函数。常见的连接函数有: Gz=expz1+expz=Λ(z), 该函数是标准logistic随机变量的累积分布函数: 常见的连接函数还有标准正态的累积分布函数,G可以被表示为: Gz=Φz≡-∞x?(v)dv, ?v=(2π)-1/2exp?(-z22). 使用上述两个连接函数,我们分别建立了logit模型和probit模型。 关于logit模型和probit模型的推导: y*=β0+xβ+e, 并定义y=I(y*0), I为示性函数。 要求y*=β0+xβ+e满足CLM假设或高斯-马尔科夫假设。 显然当e服从均值为0的正态分布,或者logistic分布,其都关于0点对称,则有: Py=1x=Py*0x=Pe-β0-xβx=1-G(-β0-xβ)=G(β0+xβ), 也即:Py=1x=G(β0+xβ). 从该推导中我们知道E(y*|x)=β0+xβ,但由于y*的不可观测性β本身的含义并不直观,也并不很有用,虽然Eyx=Py=1x=G(β0+xβ)和E(y*|x)=β0+xβ中x的影响方向具有一致性(这一点由下面推导保证)。我们关心解释变量对y的偏效应,由于G(.)的非线性,对连续变量的情形就得依赖于偏导技术: ?p(x)?xj=?G(β0+xβ)?xjβj=g(β0+xβ)βj, 其中g为概率密度函数,由于g0,所以偏效应的方向取决于βj。 一个有趣的结论是:任意两个自变量的偏效应之比等于其系数之比。此外,偏效应方程告诉我们偏效应依赖于密度函数的位置和β的大小,从而logit模型和probit模型的最大偏效应位置出现在?0=(2π)-1/2≈.4和gz|z=0=exp?(z)(1+expx)2|z=0=0.25. 而对于二值变量情形,则其偏效应相对来说容易确定,例如,x1是一个二值变量,则其偏效应为: Gβ0+β1+β2x2+…+βkxk-Gβ0+β2x2+…+βkxk。其它离散变量情况类似。 考虑如下问题的偏效应: Py=1x=G(β0+β1z1+β2z12+β3logz2+β4z3). 对于上述问题,有时还要考虑响应概率相对于一个解释变量的弹性: Py=1x对z2的弹性为:β3gβ0+xβ/G(β0+xβ); Py=1x对z3的弹性为:β4z3gβ0+xβ/G(β0+xβ); 对含解释变量交互项的模型可能会更难处理,可依赖于偏导数讨论。 logit和probit模型的极大似然估计 极大似然法(maximum likelihood estimation , MLE)是基于条件分布的估计量,故一般其是有效估计和考虑了异方差性Varyx。其可用于对受限因变量模型的估计。 假定有一个样本量为n的样本,为了得到极大似然估计量,需要给出yi在给定xi下的分布函数: fyixi;β=[G(xiβ)]yi[1-G(xiβ)]1-yi,yi=0,1 对上述方程取自然对数: liβ=yilogGxiβ+1-yilog(1-G(xiβ)), 对上述方程求和,得到对数似然函数: L(β)=i=1nliβ, 则最大化上述函数可求得β的MLE估计量,记为β,对数似然函数值一般是负值。 极大似然估计量一般是一致的、渐近正态的和渐近有效的(Wooldrige,2002,C13)。其标准误和检验统计量一般统计软件都会提供。 多重约束性检验 有三种常用的排除性约束检验统计量:Lagrange multiplier or score test(Wooldrige,2002,C15);Wa

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档