- 1、本文档共93页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.3-离散计数数据模型
该统计量为各样本观察值的偏差之和。如果拟合达到完美状态,则该统计量为零。 分子和分母都衡量了模型在只有一种观察值的模型基础上的改进,分母为改进的最大空间。所以该统计量的数值在0到1之间。 “仿R2”统计量 参数约束检验举例 三种经典检验方法 LR test (likelihood ratio test) Wald test LM test (Lagrange multiplier test) 三个统计量都服从 分布,自由度为约束条件的个数 用LR统计量进行假设检验 0假设为:制造年份对事故次数无影响 拒绝0假设 四、离散计数模型的扩展☆ 1、不可观测的异质性 均值函数 y的边缘分布为 g(.)为u的概率密度函数 令 假定 为泊松分布 Gamma混合 Gamma分布 为 假设u为Gamma分布 为负二项分布 Inverse Gaussian混合 u为inverse Gaussian分布 Log-Normal混合 exp(u)为均值为 ,方差为 的正态分布 2、负二项分布模型(Negative Binomial Regression Model) 由于泊松模型假定被解释变量的均值等于方差,人们提出了许多替代该模型的方法。其中应用得较多的是负二项分布模型。 Cameron和Trivedi在1986年提出负二项分布的一种形式。 引入无法观察的随机影响来使泊松模型一般化 被解释变量的条件分布 被解释变量的分布 该分布是负二项分布的一种形式。 其条件均值为λi,条件方差为λi(1+1/θ)λi)。 由概率密度可以求得最大似然函数,再通过迭代法求出参数估计。 对于负二项分布假设可以用Wald或者LR统计量进行检验。 负二项分布回归模型☆ ACCIDENTS = @EXP(1.520444133*TYPEA + 2.270100317*TYPEB + 0.4581374106*TYPEC + 0.6449816375*TYPED + 1.358883951*TYPEE - 0.8616385402*YEAR60 + 0.2032389361*YEAR65 + 0.9661619692*YEAR70 - 0.7020010667*YEAROP60 + 7.402025976e-05*SERVMONTH) 3、固定效应Panel Data模型 如果 是均值为 的独立泊松分布,由前面定理可知, 是均值为 的泊松分布 ui被消除了,对数似然函数为 4、随机效应Panel Data模型 假设 服从gamma分布 类似不可观测异质性中的gamma混合,只是用ui代替uit 5、截断(Truncated )离散计数模型 当 时,原始被解释变量可以被观测到 观测数据的分布函数为 在0处截断的模型分布函数为 6、归并(censored )离散计数模型 当A为集合 时,观测数据的概率函数是 7、零变换泊松模型(Hurdle and Zero-Altered Possion Models) 在某些情况下,被解释变量为零值的产生过程与它取正值的过程差异很大。于是就有人提出了零变换泊松模型来描述这个事实。 Mullahey(1986)最先提出了一个Hurdle模型,用白努利分布来描述被解释变量分别为零值和正值的概率。 改变了被解释变量取零值的概率,但是所有取值的概率之和保持为1 Mullahey(1986),Lambert(1992)等人还分析了在hurdle模型的一种扩展情况,即假定被解释变量的零值产生于两个区域(regime)中的一个。在一个区域里,被解释变量总是零,而另一个区域里,被解释变量的取值符合泊松过程,既可能产生零,也可能产生其他数值。 如Lambert对给定时间段内生产的次品数量建立的模型,在生产过程得到控制的情形下,次品产出为零,而生产过程不受控制时,产生的次品数量服从泊松分布,既可能为零,也可能不为零。 模型形式如下: 如果用z表示白努利分布的两种情况,事件发生在区域1时令z=0,发生在区域2时令z=1,并用y*表示区域2内被解释变量服从的泊松过程,则所有观察值都可以表示为z× y* 。 于是这个分离模型可表示为(式中F为设定的分布函数): Lambert(1992)和Greene(1994)考虑了许多方法,其中包括应用logit和probit模型描述两个区域各自的发生概率。 这些修正的方法都改变了泊松过程,即均值和方差不再相等。 关于分离模型的进一步探讨比较复杂,请同学们自行参考Gre
文档评论(0)