- 15
- 0
- 约5.27千字
- 约 32页
- 2019-09-30 发布于安徽
- 举报
3 零膨胀负二项回归(ZINB)的操作 仍然利用“fish.dta”的数据,我们来拟合零膨胀负二项回归,并汇报Vuong统计量以及似然比检验。 zinb count persons livebait, inf(child camper) vuong zip 这里,被解释变量为count,解释变量为persons和livebait,决定是否捕鱼的变量为child和camper。 习题 1.利用本书附带光盘data文件夹下“poissonreg.dta”工作文件对决定初中生旷课天数的因素进行分析。主要变量包括: id=学生的编号,school=学校,male=是否男生,math=数学课成绩,langarts=语言艺术课成绩,daysatt=在校天数,daysabs=旷课天数。 以daysabs为被解释变量,以male和langarts为解释变量,进行泊松回归模型的拟合。 下图列出了数据的基本情况。 2.在习题1的回归之后,对旷课天数进行预测,并比较使用不同选项时的预测结果。 3.对习题1中的泊松回归模型进行拟合优度检验,并对结果进行解释。 4.对于习题1中的数据,使用负二项回归重新进行拟合。 5.使用实验10-3中“fish.dta”文件的前150个数据进行零膨胀泊松回归,并对结果进行解读。 6.使用“fish.dta”文件的前150个数据进行零膨胀负二项回归,尝试使用不同的选项和模型设定形式,并对结果进行解读。 7.使用“fish.dta”文件的全部数据进行ZINB回归,然后进行预测,使用不同的选项。 知识回顾Knowledge Review 主要内容 泊松回归模型 负二项和广义负二项回归模型 零膨胀回归模型 实验10-1:泊松回归模型 实验基本原理 对上式两边取对数可得对数似然函数,之后对β求导便可得最大似然估计值。 实验内容及数据来源 本书附带光盘data文件夹下的“airinjure.dta”工作文件,给出了美国九家大的航线一年中的伤亡人数数据。 变量包括airline=航线,injuries=该航线一年的伤亡人数,n=各航线飞离纽约的航班数量占全部飞离纽约的航班数量的比例,XYZowned=航线是否为XYZ公司所拥有(1代表为XYZ公司拥有,0代表为其他公司拥有)。利用这些数据,我们分析XYZ公司拥有的航线是否有更高的伤亡率。 因为被解释变量injuries为计数数据,所以我们考虑使用泊松模型。利用“airinjure.dta”的数据,我们将讲解泊松回归的操作、拟合优度的检验以及模型的预测。 实验操作指导 1 泊松回归的操作 (1)泊松回归的基本操作 进行泊松回归的基本命令如下: poisson depvar [indepvar] [if] [in] [weight] [,options] 其中,poisson代表“泊松回归”的基本命令语句,depvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。 表10.2显示了各options选项及其含义。 (2)计算发生率比IRR 我们重新进行前面的回归,令其汇报发生率比。输入命令: poisson injuries XYZowned, exposure(n) irr 其中,选项exposure()约束ln(n)的系数为1,irr表示结果汇报发生率比。 (3)水平形式的泊松回归 我们先产生一个变量ln(n),然后再进行泊松回归。 gen lnn=ln(n) poisson injuries XYZowned lnn 其中,第一步为产生一个新变量lnn,其值为n的自然对数;第二步进行泊松回归,被解释变量为injuries,解释变量为XYZowned和lnn。 2.泊松回归的检验和预测 (1)拟合优度(goodness of fit)检验 命令estat gof 用于检验模型是否与数据吻合良好。在泊松回归之后进行该检验,原假设为模型服从泊松分布。当p值很小时,我们就应该拒绝原假设。 对前面回归的模型进行拟合优度检验,命令为: quietly poisson injuries XYZowned, exposure(n) estat gof 其中,第一步命令中的quietly用于指示stata不显示该步的结果;第二步为拟合优度的检验。 (2)泊松回归的预测 预测的基本命令格式为: predict [type] newvar [if] [in] [, statistic nooffset] 其中,predict是预测的基本命令语句,newvar
原创力文档

文档评论(0)