chap10 计数模型chp10 计数模型chap10 计数模型chap10 计数模型.ppt

下载文档 降价啦

8
0
约5.25千字
约 31页
2017-03-18 发布于贵州
举报
版权申诉
保障服务

chap10 计数模型chp10 计数模型chap10 计数模型chap10 计数模型.ppt

1、本文档共31页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

习题 1.利用本书附带光盘data文件夹下“poissonreg.dta”工作文件对决定初中生旷课天数的因素进行分析。主要变量包括： id=学生的编号，school=学校，male=是否男生，math=数学课成绩，langarts=语言艺术课成绩，daysatt=在校天数，daysabs=旷课天数。以daysabs为被解释变量，以male和langarts为解释变量，进行泊松回归模型的拟合。下图列出了数据的基本情况。 2.在习题1的回归之后，对旷课天数进行预测，并比较使用不同选项时的预测结果。 3.对习题1中的泊松回归模型进行拟合优度检验，并对结果进行解释。 4.对于习题1中的数据，使用负二项回归重新进行拟合。 5.使用实验10-3中“fish.dta”文件的前150个数据进行零膨胀泊松回归，并对结果进行解读。 6.使用“fish.dta”文件的前150个数据进行零膨胀负二项回归，尝试使用不同的选项和模型设定形式，并对结果进行解读。 7.使用“fish.dta”文件的全部数据进行ZINB回归，然后进行预测，使用不同的选项。主要内容泊松回归模型负二项和广义负二项回归模型零膨胀回归模型实验10-1：泊松回归模型实验基本原理对上式两边取对数可得对数似然函数，之后对β求导便可得最大似然估计值。实验内容及数据来源本书附带光盘data文件夹下的“airinjure.dta”工作文件，给出了美国九家大的航线一年中的伤亡人数数据。变量包括airline=航线，injuries=该航线一年的伤亡人数，n=各航线飞离纽约的航班数量占全部飞离纽约的航班数量的比例，XYZowned=航线是否为XYZ公司所拥有（1代表为XYZ公司拥有，0代表为其他公司拥有）。利用这些数据，我们分析XYZ公司拥有的航线是否有更高的伤亡率。因为被解释变量injuries为计数数据，所以我们考虑使用泊松模型。利用“airinjure.dta”的数据，我们将讲解泊松回归的操作、拟合优度的检验以及模型的预测。实验操作指导 1 泊松回归的操作（1）泊松回归的基本操作进行泊松回归的基本命令如下： poisson depvar [indepvar] [if] [in] [weight] [,options] 其中，poisson代表“泊松回归”的基本命令语句，depvar代表被解释变量的名称，indepvar代表解释变量的名称，if代表条件语句，in代表范围语句，weight代表权重语句，options代表其他选项。表10.2显示了各options选项及其含义。（2）计算发生率比IRR 我们重新进行前面的回归，令其汇报发生率比。输入命令： poisson injuries XYZowned, exposure(n) irr 其中，选项exposure()约束ln(n)的系数为1，irr表示结果汇报发生率比。（3）水平形式的泊松回归我们先产生一个变量ln(n)，然后再进行泊松回归。 gen lnn=ln(n) poisson injuries XYZowned lnn 其中，第一步为产生一个新变量lnn，其值为n的自然对数；第二步进行泊松回归，被解释变量为injuries，解释变量为XYZowned和lnn。 2.泊松回归的检验和预测（1）拟合优度（goodness of fit）检验命令estat gof 用于检验模型是否与数据吻合良好。在泊松回归之后进行该检验，原假设为模型服从泊松分布。当p值很小时，我们就应该拒绝原假设。对前面回归的模型进行拟合优度检验，命令为： quietly poisson injuries XYZowned, exposure(n) estat gof 其中，第一步命令中的quietly用于指示stata不显示该步的结果；第二步为拟合优度的检验。（2）泊松回归的预测预测的基本命令格式为： predict [type] newvar [if] [in] [, statistic nooffset] 其中，predict是预测的基本命令语句，newvar代表生成的新变量的名称，type代表新变量的类型，if代表条件语句，in代表范围语句，statistic代表要预测的统计量。表10.3显示了各statistic统计量及其含义。实验10-2：负二项和广义负二项回归模型实验基本原理实验内容及数据来源本书附带光盘data文件夹下的“mortality.dta”工作文件给出了不同时期儿童死亡人数的调查数据。变量包括：cohort=分组变量（1代表出生于1941-1959