网站大量收购闲置独家精品文档,联系QQ:2885784924

第六章受限因变量模型颜莹.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter 6 受限因变量模型 本章讨论的一类模型是被关注的因变量的取值受到限制。有时候这种限制不需要特别的处理,但有时候这种限制却是实质性的。从条件期望的角度看,如果限制的信息是确定的,例如,只取有限个离散值,如(表示赞成),(表示反对)。于是,用线性回归模型的方式来表示就不合适了。我们将依据受不同限制的情况处理几类不同的非线性模型,并给出非线性模型的常用估计检验方法—极大似然方法。按理,非线性模型是下篇的内容,之所以要介绍受限因变量模型是因为它的背景与多元回归模型有关。 另外,本章的附录部分简单的介绍非线性理论,这是伍书的第12章。 §1。离散响应模型 有时,我们只能观察到处于某种状态,用1表示,用0表示不处于该状态。如(就业),(失业),或仅有几种很少的状态可供选择,我们把仅取有限的离散值情况称为离散响应模型。特别,仅取0、1为值称为二元响应模型。同样,影响的状态的因素称为解释变量或相关变量,可能包括有关个体的各种情况,如教育程度,年龄,性别…等,它们都有可能影响的就业状态。 关注的问题:中多大程度上影响了的状态? 这个问题准确的表达是,设,是一个条件概率。解释变量可以是连续型的也可以是离散型的。那么对连续变量,就用边际效应反映对状态的影响,对二元变量,(取0,1为值。)就用差分效应 反映对状态的影响。以上两式,如果已知就没有问题了。问题是如何确定? (1)二元响应的线性概率模型 最简单的是认为仍是的线性函数,改写成: 。 ∵,则。是一个二元分布。 ∴,且。 ∴,且。 这说明,如果用线性投影来拟合,则存在条件异方差。(方差与样本有关) 注意:采用线性概率模型,未知参数的含义,当取连续值;当取离散值,。 由,利用,给定样本,。可得的一致估计。又由存在条件异方差,故不是有效的,再改用加权最小二乘(WLS)加以修正,做法是,对所有满足条件的样本,定义标准差,然后对,。做回归,得,可增加有效性。 关于检验,所有关于的检验、检验以及部分参数为0的检验,用稳健的异方差协差矩阵和标准差都是有效的。但是线性概率模型在理论上是有欠缺的,因为拟合值有可能不在区间内,即使都在中,但预测值随着其解释变量不断增加或减少,终将导致不在区间内,这与概率的意义是不相符的。 尽管如此,如果主要目的是估计中每个解释变量对影响的平均概率,那么一些预测值不在中影响不大,线性概率模型不必对取极端值给出一个好的估计。 (2) 二元响应的指数(Index)模型(probit 和 logit 模型) 考虑二元响应的概率有形式:。 这里,。,。特别就是线性概率模型。因为先把理解成一个指数(Index),函数再把指数映射成一个响应函数。故称模型为指数模型,在实践中一般取累积分布函数的形式。 如果是某一随机变量的分布函数,那么二元响应的指数模型可以从存在潜在变量的线性模型中得到解释: 设,且。不可观测,但如果则可观测,是关于原点对称与不相关的连续型随机变量。如果是的分布函数,那么, 且。因此, 。 注:没有特别的理由要求是关于原点对称的。但为了方便,对二元响应模型已作为一种习惯限制。没有此限制二元响应模型就不能看成是存在潜在变量的模型。二元响应不采用存在潜在变量的说法是因为无法准确定义潜在变量的含义和测量单位,从而参数的大小也没有特定的意义。 另外,一般对的要求也不非要是分布函数,只要满足在区间即可,但在实际应用时,有两个常用的选择,一个是服从标准正态分布,称Probit模型;另一个是服从标准Logistic分布,称为Logit模型。 1.当服从标准正态分布,则的分布函数形式为 2.当服从Logistic的分布,则,有性质。 于是,在指数模型中,的含义就不如线性概率模型那样明显。 因为当连续时,,且。 ∴如果是分布函数,则,。故的符号给出了对的正影响和负影响,而的大小则没有太大的增量意义。另外,当的密度关于原点对称时,,取得最大值,从而在时对有最大影响。 其次当是二元解释变量,那么当改变到1,其他变量不变,对产生的偏效应就是该值是依赖于其他解释变量取值,不过的符号同样能决定对产生的偏效应是正还是负。一般的,当改变到,其他变量不变,那么对产生的偏效应就是。 由,有时也常用表示改变百分之一对产生的偏效应。偏效应比:,当和是连续型时,则不依赖的分布函数。 (3)二元响应的极大似然估计和检验 给定样本观测值,要求极值: 。 ∵, ∴。 。由一阶条件, ,即 。 得, 。 这是一个关于的非线性方程组,采用非线性方程算法可求得的极大似然估计量。 注:一般情况下,上述方程要有解,要求样本容量是和自变量个数及的均值满足条件。含义是,取1的个数和取0的个数都必须大于。例如都取1,则方程无解。 ∴当取标准正态公布, ,。 ∴一阶条件就是表示成 。 又当取Logistic分布, ,

文档评论(0)

185****7617 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档