4.6-持续时间数据模型.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
三、实例 1、问题 医生在诊断肺癌时,常常需要做一个判断,即病人还能够生存多长时间,或者哪些因素影响着病人的生存时间(更具体的说,某种特殊治疗能否显著延长病人的生存时间)。基于对这些问题的准确回答,医生能够给病人制定更合理的治疗方案,研究者可以对相关课题进行更为深入的研究。 本例题试图通过对相关临床数据的分析找出影响肺癌患者生存时间的因素,并根据分析结果提出有临床意义的结论和建议。 2、数据来源和相关说明 本例题所利用的数据来源于(美国)退伍军人管理局肺癌研究集团(Veterans Administration Lung Cancer Study Group)。 该数据共包含了137个进展期肺癌(Advanced Lung Cancer)患者的资料,其中128人在研究期间死去,9人活过了最后的研究期限。对于每一个病人,研究者收集并研究了9个变量信息。 本例题采用R程序实现描述性分析和模型估计。 生存时间(Stime)是被解释变量,其他变量均为解释性变量。 生存状态为“死亡”(即Status=1)时,Stime即为实际的生存时间;生存状态为“生存”(即Status=0)时,意味着在该研究结束之前,没有观测到病人的确切生存时间,因此从数据中仅仅知道他的生存时间要大于Stime的取值,但是到底大多少是不知道的。 3、描述性分析 在进行模型估计之前,分别对各个变量与生存时间之间的关系进行描述性分析,是十分必要的。 通过描述性分析,可以得到以下初步结论: 卡式评分(Karn)是影响肺癌患者生存时间的显著因素; 治疗方法(Treat)、确诊时年龄(Age)、肿瘤细胞类型(Cell)、研究之前有否治疗(Prior)对肺癌患者生存时间有一定影响;其中,治疗方法(Treat)、肿瘤细胞类型(Cell)对患者生存时间的影响在不同生存时间范围内各自不同; 从确诊到研究开始的时间(Diag.time)对肺癌患者生存时间基本无影响。 4、加速死亡模型及模型选择 首先使用生存分析中常用的加速死亡模型进行拟合。 结论: 模型整体非常显著(P值=1.1e-08),即各解释性变量联合起来对因变量的解释程度非常高。 在10%的显著性水平下,卡式评分(Karn)能够显著影响肺癌患者的生存时间,且影响为正——卡式评分越高的患者,其生存时间越长; 在10%的显著性水平下,肿瘤细胞类型(Cell)能够显著影响肺癌患者的生存时间,且影响为负——肿瘤细胞越大的患者,其生存时间越短; 其他4个因素(治疗方法、确诊时年龄、从确诊到研究开始的时间、研究之前有否治疗)对肺癌患者生存时间没有显著影响。 为考察该模型的稳定性,假设残差项服从指数分布,再次对加速死亡模型进行拟合,得到与Weibull分布假设非常类似的结果。 为了获得更为可靠的结果,利用AIC信息准则来进行模型选择。(残差项服从指数分布) 5、Cox等比例转换模型及模型选择 为了获得更全面、更可靠的结论,考虑使用Cox等比例转换模型,表达式为: 通过极大化似然函数的方法得到如下模型拟合结果 为获得更可靠的结果,利用AIC信息准则来进行模型选择 模型整体显著性水平得到改善,p值有所提高。 AIC发现了两个重要解释性变量,分别是卡式评分(Karn)、肿瘤细胞类型(Cell)。 AIC所选出的模型关于这两个变量的结论与全模型相同,依然认为卡式评分越高的患者生存时间越长,肿瘤细胞越大的患者生存时间越短。 风险函数,表示给定个体i已经存活了时间Stime,该个体立刻死亡的可能性。 基准风险函数,即该个体在不受外生变量影响的情况下的风险函数。对该函数形式不做任何假设,在计算似然函数过程中,它在分子和分母中相互抵消。 在10%的显著性水平下,卡式评分(Karn)、肿瘤细胞类型(Cell)依然是显著的影响因素。 注意:Cox模型所拟合出来的Karn系数为负、Cell系数为正,恰好与加速死亡模型结果相反。表明卡式评分高的患者,风险函数较小;肿瘤细胞大的患者,风险函数较大。这与加速死亡模型的结论相同。 卡式评分(Karn)、肿瘤细胞类型(Cell)是非常重要的影响因素。 AIC准则所选出的模型依然包含卡式评分(Karn)、肿瘤细胞类型(Cell)两个解释性变量。卡式评分高的患者风险函数低,这与加速死亡模型的结论一致;但肿瘤细胞类型这一解释性变量的显著程度有所下降。 加速死亡模型与Cox等比例风险模型给出了略微不同的结论,但从保守而稳妥的角度,可以认为卡式评分(Karn)、肿瘤细胞类型(Cell)这两个因素都能显著影响肺癌患者的生存时间,而且卡式评分(Karn)的影响尤为明显。 §4.6 持续时间数据模型 Duration Data Model 一、计量经济学中持续时间分析问题的提出 二

文档评论(0)

xina171127 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档