4.3-离散计数数据模型.pptVIP

下载本文档

25
0
约7.03千字
约 93页
2018-05-10 发布于河北
举报
版权申诉

4.3-离散计数数据模型.ppt

1、本文档共93页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

4.3-离散计数数据模型

该统计量为各样本观察值的偏差之和。如果拟合达到完美状态，则该统计量为零。分子和分母都衡量了模型在只有一种观察值的模型基础上的改进，分母为改进的最大空间。所以该统计量的数值在0到1之间。 “仿R2”统计量参数约束检验举例三种经典检验方法 LR test (likelihood ratio test) Wald test LM test (Lagrange multiplier test) 三个统计量都服从分布，自由度为约束条件的个数用LR统计量进行假设检验 0假设为：制造年份对事故次数无影响拒绝0假设四、离散计数模型的扩展☆ 1、不可观测的异质性均值函数 y的边缘分布为 g(.)为u的概率密度函数令假定为泊松分布 Gamma混合 Gamma分布为假设u为Gamma分布为负二项分布 Inverse Gaussian混合 u为inverse Gaussian分布 Log-Normal混合 exp(u)为均值为，方差为的正态分布 2、负二项分布模型（Negative Binomial Regression Model）由于泊松模型假定被解释变量的均值等于方差，人们提出了许多替代该模型的方法。其中应用得较多的是负二项分布模型。 Cameron和Trivedi在1986年提出负二项分布的一种形式。引入无法观察的随机影响来使泊松模型一般化被解释变量的条件分布被解释变量的分布该分布是负二项分布的一种形式。其条件均值为λi，条件方差为λi（1+1/θ）λi）。由概率密度可以求得最大似然函数，再通过迭代法求出参数估计。对于负二项分布假设可以用Wald或者LR统计量进行检验。负二项分布回归模型☆ ACCIDENTS = @EXP(1.520444133*TYPEA + 2.270100317*TYPEB + 0.4581374106*TYPEC + 0.6449816375*TYPED + 1.358883951*TYPEE - 0.8616385402*YEAR60 + 0.2032389361*YEAR65 + 0.9661619692*YEAR70 - 0.7020010667*YEAROP60 + 7.402025976e-05*SERVMONTH) 3、固定效应Panel Data模型如果是均值为的独立泊松分布，由前面定理可知，是均值为的泊松分布 ui被消除了，对数似然函数为 4、随机效应Panel Data模型假设服从gamma分布类似不可观测异质性中的gamma混合，只是用ui代替uit 5、截断（Truncated ）离散计数模型当时，原始被解释变量可以被观测到观测数据的分布函数为在0处截断的模型分布函数为 6、归并（censored ）离散计数模型当A为集合时，观测数据的概率函数是 7、零变换泊松模型（Hurdle and Zero-Altered Possion Models）在某些情况下，被解释变量为零值的产生过程与它取正值的过程差异很大。于是就有人提出了零变换泊松模型来描述这个事实。 Mullahey(1986)最先提出了一个Hurdle模型，用白努利分布来描述被解释变量分别为零值和正值的概率。改变了被解释变量取零值的概率，但是所有取值的概率之和保持为1 Mullahey(1986)，Lambert(1992)等人还分析了在hurdle模型的一种扩展情况，即假定被解释变量的零值产生于两个区域（regime）中的一个。在一个区域里，被解释变量总是零，而另一个区域里，被解释变量的取值符合泊松过程，既可能产生零，也可能产生其他数值。如Lambert对给定时间段内生产的次品数量建立的模型，在生产过程得到控制的情形下，次品产出为零，而生产过程不受控制时，产生的次品数量服从泊松分布，既可能为零，也可能不为零。模型形式如下：如果用z表示白努利分布的两种情况，事件发生在区域1时令z=0，发生在区域2时令z=1，并用y*表示区域2内被解释变量服从的泊松过程，则所有观察值都可以表示为z× y* 。于是这个分离模型可表示为（式中F为设定的分布函数）： Lambert（1992）和Greene（1994）考虑了许多方法，其中包括应用logit和probit模型描述两个区域各自的发生概率。这些修正的方法都改变了泊松过程，即均值和方差不再相等。关于分离模型的进一步探讨比较复杂，请同学们自行参考Gre