Stata实验指导、统计分析与应用chap10课件.pptVIP

Stata实验指导、统计分析与应用chap10课件.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第十章;主要内容;实验10-1:泊松回归模型

;实验操作指导

1泊松回归的操作

(1)泊松回归的基本操作

进行泊松回归的基本命令如下:

poissondepvar[indepvar][if][in][weight][,options]

其中,poisson代表“泊松回归”的基本命令语句,depvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。;表10.2显示了各options选项及其含义。

;(2)计算发生率比IRR

我们重新进行前面的回归,令其汇报发生率比。输入命令:

poissoninjuriesXYZowned,exposure(n)irr

其中,选项exposure()约束ln(n)的系数为1,irr表示结果汇报发生率比。;2.泊松回归的检验和预测

(1)拟合优度(goodnessoffit)检验

命令estatgof用于检验模型是否与数据吻合良好。在泊松回归之后进行该检验,原假设为模型服从泊松分布。当p值很小时,我们就应该拒绝原假设。

对前面回归的模型进行拟合优度检验,命令为:

quietlypoissoninjuriesXYZowned,exposure(n)

estatgof

其中,第一步命令中的quietly用于指示stata不显示该步的结果;第二步为拟合优度的检验。;实验内容及数据来源

本书附带光盘data文件夹下的“mortality.dta”工作文件给出了不同时期儿童死亡人数的调查数据。变量包括:cohort=分组变量(1代表出生于1941-1959年间,2代表出生于1960-1967年间,3代表出生于1968-1976年间),age_mos=死亡时的年龄(单位为月),deaths=死亡人数,exposure=暴露于风险的总年数(=儿童人数*相应的年龄)。

利用这些数据,我们研究不同年代对儿童死亡率的影响。我们会进行泊松回归及其拟合优度检验,负二项回归以及广义负二项回归。

;实验操作指导

1泊松回归及拟合优度检验

因为我们要进行的回归分析中,被解释变量死亡人数是计数变量,因此,我们首先考虑进行泊松回归。命令如下:

genlogexp=ln(exposure)

xi:poissondeathsi.cohort,offset(logexp)

其中,第一步生成了一个新变量logexp,其值为变量exposure的自然对数;第二步为泊松回归。

在第二步中,xi表示生成扩展交互项(interactionexpansion),在这里,解释变量cohort之前有前缀“i.”,即表示生成cohort的虚拟变量??因为分组变量cohort取值为1、2、3,所以会生成3个虚拟变量)。也就是说,被解释变量为deaths,解释变量为虚拟变量_Icohort_1、_Icohort_2和_Icohort_3。为避免多重共线性,stata会自动删掉一个虚拟变量。此外,选项offset(logexp)表明约束logexp的系数为1,这是因为我们要研究组别对死亡率的影响,而死亡人数除以暴露期才是死亡率。;对上面的回归进行拟合优度检验:

estatgof

结果显示,我们应当拒绝数据服从泊松回归的原假设。

;2负二项回归

对“mortality.dta”的数据进行泊松回归后,拟合优度检验表明泊松回归模型是不合适的。这样,我们考虑用负二项回归模型。

负二项回归的基本命令格式为:

nbregdepvar[indepvar][if][in][weight][,nbreg_options]

其中,nbreg代表“负二项回归”的基本命令语句,depvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,nbreg_options代表其他选项。

;下面,我们利用“mortality.dta”的数据进行负二项回归,命令为:

xi:nbregdeathsi.cohort,offset(logexp)nolog

其中,被解释变量为deaths,解释变量为cohort的虚拟变量,选项offset(logexp)约束logexp的系数为1,nolog表明不显示迭代过程。

;4模型的预测

负二项回归和广义负二项回归的模型预测和泊松回归的模型预测大致相同,只有几个选项不一样。预测的基本的命令格式如下:

predict[type]newvar[if][in][,statisticnooffset]

其中,predict代表预测的基本命令语句,newvar代表生成的新

文档评论(0)

可爱的家人6536 + 关注
实名认证
文档贡献者

可爱的家人

1亿VIP精品文档

相关文档