- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SPSSAU-在线SPSS分析软件
零膨胀泊松回归零膨胀负二项回归SPSSAU
零膨胀泊松回归分析
计数研究模型中,常用泊松回归模型,但泊松回归模型理论上是要求平均值与标准差相等,
如果不满足,则可使用负二项回归模型。
在实际研究中,会出现一种情况即因变量为计数变量,并且该变量包括非常多的数字0,当
出现此种情况下,此时可考虑使用零膨胀泊松回归模型,也或者零膨胀负二项回归模型。零膨胀
模型的特点是将模型分为两阶段进行(即设置为混合分布模型),第1阶段(零膨胀阶段)为计
数变量是否为0的拟合,SPSSAU默认使用二元logit模型进行拟合,第2阶段为泊松分布模型
拟合。零膨胀泊松回归模型如下所示:
零膨胀泊松回归模型分为两个阶段,第1阶段即零膨胀阶段可拟合因变量是否为0,此阶段
中可放入一些自变量X用于拟合因变量是否取数字0的模型,当然也可不放入;第2阶段放入
的自变量X为真实研究的变量项。
实际研究中,如果因变量中出现较多的数字0时,则可使用零膨胀泊松回归进行研究,当然
还可以使用零膨胀负二项回归模型。至于零膨胀泊松回归模型与零膨胀负二项回归模型的选择
上,建议可结合AIC或BIC信息准则进行判断,以信息准则值较小的模型作为最终模型。除此
之外,相关文献中还使用Vuong检验进行判断,该检验在学术研究中受到置疑问,SPSSAU暂未
来提供该检验(具体可参考下述文献:WilsonP.ThemisuseoftheVuongtestfornon-nestedmodels
totestforzero-inflation[J].EconomicsLetters,2015.)。
SPSSAU-在线SPSS分析软件
零膨胀泊松回归案例
Contents
1背景2
2理论2
3操作3
4SPSSAU输出结果3
5文字分析4
6剖析5
1背景
当前有一份关于美国犯罪率的研究,数据包括被捕次数,该变量为计数变量,并且包括大量
的数字0(即被捕次数为0),除此之外,包括另外5个自变量,分别是‘有前科比例’、‘平均判邢
月数’、‘18岁以来入狱月数’、‘1986年合法收’和‘是否黑人’,其中是否黑人这项,使用数字1表
示黑人,数字0表示不是黑人。部分数据截图如下:
2理论
零膨胀泊松回归模型研究X对于Y的影响,且Y为计数变量且Y包括较多的数字0。除此
之外,零膨胀泊松回归模型分为两个阶段,第1阶段为判断Y是否为0的二元logit模型,第1
阶段中可包括影响Y是否为数字0的影响因素X,当然也可没有(如果没有此为常数);第2阶
段为真实的研究模型。
特别提示:
✓很多时候需要零膨胀泊松回归模型与零膨胀负二项回归模型进行选择对比使用,建议
SPSSAU-在线SPSS分析软件
结合模型输出的AIC或BIC信息准则,以该两值较小值对应的模型作为最终模型。
✓研究中也可考虑首先过滤掉数字0然后进行普通泊松回归(甚至OLS回归研究),但
此种做法会丢失大量有意义样本。
3操作
本例子中研究被捕次数的影响因素,其中影响因素包括‘有前科比例’、‘平均判邢月数’、‘18
岁以来入狱月数’、‘1986年合法收’和‘是否黑人’,操作截图如下。
本案例时第1阶段零膨胀模型并不包括任何影响因素,因而‘零膨胀项X【可选】’框留空,
不放入分析项。与此同时,本案例数据为原始数据并非带‘基数Exposure’格式数据,因而基数项
框留空。
4SPSSAU输出结果
零膨胀泊松回归模型一共输出4个表格,说明如下:
表格名称说明
零膨胀数据汇总结果展示因变量中数字0和不是数字0的分布情况
零膨胀泊松回归模型似然比检验
文档评论(0)