离散计数数据模型.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
离散计数数据模型

离散计数数据模型(Models For Count Data) 离散计数数据模型的经济背景 在接触离散计数数据模型之前,我们可以先考虑一个跟劳动力市场有关的例子:我们知道,每个人在进入劳力市场以前肯定都有一定的教育背景和职业经历。这些东西构成了一定的人力资本,个人凭借它得到工作机会。但是,一个很有意思的现象是,有的人终其一生都只为一个雇主工作,而有的人却经常炒自己上司的“鱿鱼”。究竟是哪些因素在决定雇员跳槽频率方面起着重要作用呢?有些经济学家据此将一定时间内雇员工作更换的次数作为跳槽频率的测度,试图通过实证分析来解决这类问题。这就引出了我们即将讨论的计数数据模型。 通常计数数据模型的形式可以表示如下: 这其中N代表被解释变量,通常为正整数,N和X之间的关系由经济理论决定。该模型假定,通过调查我们能够得到一组代表被解释变量的数字,(如0,2,4,3…)以及相应的解释变量的观察值。建立模型的目的主要有两点: 检验从数据中可以观察到的行为模式是否与理论预期相符; 将N和X之间的内在联系用数量化的方式表现出来。 从理论上讲,多元线性方程的参数估计方法也可以被应用来分析计数数据模型问题。但是我们很容易就能够看到,计数数据中零元素和绝对值较小的数据出现得较为频繁,而且离散特征十分明显,利用这些特点,也许可以找到更合适的估计方法。七十年代末以来,许多学者在计数数据模型的处理方法方面作出了较大贡献,这其中包括:Gilbert(1979),他提出了泊松回归模型,Hausman,Hall和Griliches(1984),他们提出了负二项回归模型和Panel方法,Gourier,Monfort和Trogonon(1984),他们提出了仿最大似然法,等等。 这其中,最先提出的泊松方法在研究计数数据模型问题中应用得非常广泛。 (二)泊松回归模型(Poisson regression model) 泊松回归模型假定,被解释变量(在上例中即指一定时间内的工作更换次数)yi服从参数为(i的泊松分布,其中(i同解释变量xi存在某种关系。该模型的初始方程为 最常用的关于(i的方程是对数线性模型,即 根据泊松分布的性质,我们很容易就可以得到 (1) 于是, 这样在得出参数(的估计值以后,我们可以很轻松地算出(i,以及yi的期望值。 方程(1)是一个非线性模型,可以用两阶段最小二乘法估计其参数,不过更简单的方法是最大似然估计法。对数似然函数为 对数似然函数最大化的一阶条件为: Hessian矩阵行如: 由此可见,对数似然函数的Hessian矩阵对任下x和(的取值是负定的。(即LnL在稳定点有极大值,稳定点指满足一阶条件的(。)我们可以利用Newton迭代法迅速地得到方程的参数估计值。(得出以后,第i个样本的被解释变量的预测值可以由(i=exp((’xi)给出,预测值的方差为,其中V是参数的渐近协方差矩阵的估计值。 1、假设检验 可以用三种标准的检验方法来检验泊松回归模型的假设。 (1)Wald统计量 其中为受到限制的解释变量的参数,。 (2)LR统计量(最大似然比) 式中的分母描述的是受到限制后的方程的解释变量的似然概率。 (3)LM统计量(拉格朗日乘子) 式中G的每一行等于X的每一行同相应的的乘积,i为每项为1的列向量。 这三个统计量都服从分布,自由度为受限变量的个数。如果统计值大于临界值,则拒绝原假设。 2、拟合优度 由于泊松模型的条件均值非线性,且回归方程存在异方差,所以它不能产生类似于线性方程中的R2统计量。不过学者提出了若干个替代性的指标,用以衡量该模型的拟合优度。 (1) 该统计量通过把泊松模型同只有一种观察值的模型相比较的方法,考察该模型的拟合优度。但是这个统计量有时为负,而且会随变量的减少而变小。 (2) 该统计量为各样本观察值的偏差(deviance)之和。如果拟合达到完美状态,则该统计量为零。 (3) 这个统计量具有较好的性质。如果我们用表示对数似然函数,其中为的估计值,则泊松模型得出的对数似然函数为,只有一种观察值的模型的函数为,理想模型的函数为。于是有 分子和分母都衡量了模型在只有一种观察值的模型基础上的改进,分母为改进的最大空间。所以该统计量的数值在0到1之间。 (4) 这是人们后来发展的“仿R2”统计量。 (三)泊松回归模型的扩展 1、截断或者归并数据问题。 在受限被解释变量问题中,我们已经学过了截断和归并问题的处理方法。泊松模型中被解释变量出现截断和归并现象时,也可以用类似的方法解决。 (1)归并问题: 根据概率分布重新写出似然函数,可以通过迭代法得到参数估计值。 (2) 截断问题: 同样依据概率分布重新写出似然函数,通过迭代法可以得到参数估计值

您可能关注的文档

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档