- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
习题 1.利用本书附带光盘data文件夹下“poissonreg.dta”工作文件对决定初中生旷课天数的因素进行分析。主要变量包括: id=学生的编号,school=学校,male=是否男生,math=数学课成绩,langarts=语言艺术课成绩,daysatt=在校天数,daysabs=旷课天数。 以daysabs为被解释变量,以male和langarts为解释变量,进行泊松回归模型的拟合。 下图列出了数据的基本情况。 2.在习题1的回归之后,对旷课天数进行预测,并比较使用不同选项时的预测结果。 3.对习题1中的泊松回归模型进行拟合优度检验,并对结果进行解释。 4.对于习题1中的数据,使用负二项回归重新进行拟合。 5.使用实验10-3中“fish.dta”文件的前150个数据进行零膨胀泊松回归,并对结果进行解读。 6.使用“fish.dta”文件的前150个数据进行零膨胀负二项回归,尝试使用不同的选项和模型设定形式,并对结果进行解读。 7.使用“fish.dta”文件的全部数据进行ZINB回归,然后进行预测,使用不同的选项。 主要内容 泊松回归模型 负二项和广义负二项回归模型 零膨胀回归模型 实验10-1:泊松回归模型 实验基本原理 对上式两边取对数可得对数似然函数,之后对β求导便可得最大似然估计值。 实验内容及数据来源 本书附带光盘data文件夹下的“airinjure.dta”工作文件,给出了美国九家大的航线一年中的伤亡人数数据。 变量包括airline=航线,injuries=该航线一年的伤亡人数,n=各航线飞离纽约的航班数量占全部飞离纽约的航班数量的比例,XYZowned=航线是否为XYZ公司所拥有(1代表为XYZ公司拥有,0代表为其他公司拥有)。利用这些数据,我们分析XYZ公司拥有的航线是否有更高的伤亡率。 因为被解释变量injuries为计数数据,所以我们考虑使用泊松模型。利用“airinjure.dta”的数据,我们将讲解泊松回归的操作、拟合优度的检验以及模型的预测。 实验操作指导 1 泊松回归的操作 (1)泊松回归的基本操作 进行泊松回归的基本命令如下: poisson depvar [indepvar] [if] [in] [weight] [,options] 其中,poisson代表“泊松回归”的基本命令语句,depvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。 表10.2显示了各options选项及其含义。 (2)计算发生率比IRR 我们重新进行前面的回归,令其汇报发生率比。输入命令: poisson injuries XYZowned, exposure(n) irr 其中,选项exposure()约束ln(n)的系数为1,irr表示结果汇报发生率比。 (3)水平形式的泊松回归 我们先产生一个变量ln(n),然后再进行泊松回归。 gen lnn=ln(n) poisson injuries XYZowned lnn 其中,第一步为产生一个新变量lnn,其值为n的自然对数;第二步进行泊松回归,被解释变量为injuries,解释变量为XYZowned和lnn。 2.泊松回归的检验和预测 (1)拟合优度(goodness of fit)检验 命令estat gof 用于检验模型是否与数据吻合良好。在泊松回归之后进行该检验,原假设为模型服从泊松分布。当p值很小时,我们就应该拒绝原假设。 对前面回归的模型进行拟合优度检验,命令为: quietly poisson injuries XYZowned, exposure(n) estat gof 其中,第一步命令中的quietly用于指示stata不显示该步的结果;第二步为拟合优度的检验。 (2)泊松回归的预测 预测的基本命令格式为: predict [type] newvar [if] [in] [, statistic nooffset] 其中,predict是预测的基本命令语句,newvar代表生成的新变量的名称,type代表新变量的类型,if代表条件语句,in代表范围语句,statistic代表要预测的统计量。表10.3显示了各statistic统计量及其含义。 实验10-2:负二项和广义负二项回归模型 实验基本原理 实验内容及数据来源 本书附带光盘data文件夹下的“mortality.dta”工作文件给出了不同时期儿童死亡人数的调查数据。变量包括:cohort=分组变量(1代表出生于1941-1959
您可能关注的文档
- b2c电子商务公司盈利模式究开题报告b2c电子商务公司盈利模式研究开题报告b2c电子商务公司盈利模式研究开题报告b2c电子商务公司盈利模式研究开题报告.doc
- b2b电子商务盈利模式b2电子商务盈利模式b2b电子商务盈利模式b2b电子商务盈利模式.ppt
- argo 介绍.ppt
- b2c和c2c操作流程(简)b2c和c2c操作流程(简版)b2c和c2c操作流程(简版)b2c和c2c操作流程(简版).ppt
- a卷2014年医学影像试题卷2014年医学影像试题a卷2014年医学影像试题a卷2014年医学影像试题.doc
- a股市场2011年投资策略客户服务部)a股市场2011年投资策略(客户服务部)a股市场2011年投资策略(客户服务部)a股市场2011年投资策略(客户服务部).ppt
- b5我收藏的2006年湖南物理科考试大纲解读(理科综合)b5我收藏的2006年湖南省物理科考试大纲解读(理科综合)b5我收藏的2006年湖南省物理科考试大纲解读(理科综合)b5我收藏的2006年湖南省物理科考试大纲解读(理科综合).doc
- b7m4集体备课b7m4集备课体备课.doc
- b3把握健康拥抱幸福未来b把握健康拥抱幸福未来b3把握健康拥抱幸福未来b3把握健康拥抱幸福未来.ppt
- avamar基本功能介绍aamar基本功能介绍avamar基本功能介绍avamar基本功能介绍.ppt
文档评论(0)