生存分析与SAS程序.docVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生存分析与SAS程序

第十一章 生存分析与SAS程序 在医学研究中,考察研究因素对研究对象的效应,经典的研究设计方法只观察其所出现的结局或结果。但是在一些诸如癌症等险恶疾病和慢性病的随访研究中,只观察其结局就不够全面,还需要考察研究对象出现某种结局所经历的时间,这段时间称为生存时间(survival time)。生存分析是用来分析生存时间资料的统计方法,是近几十年来产生且发展甚为迅速的一门应用统计的分支。到目前为止,生存分析已形成一套完整的体系,包括描述生存规律和进行组间比较的参数和非参数方法以及分析影响生存期因素的回归模型等。 本章主要介绍描述生存规律的寿命表和乘积限估计法,用于组间比较的logrank检验和作预后因素分析的Cox回归模型以及相应的SAS过程。 11.1生存分析的基本概念 11.1.1生存时间 在医学研究中,对于肿瘤、心血管等慢性疾病,要考察其治疗方法优劣,疾病预后的好坏以及影响疾病预后的因素,通常采用随访研究的方法。对某一疾病作随访研究时,一般是从某一时间开始,观察到某一规定时间截止,而研究对象是始点以后陆续进入观察。随访中要规定一个事件作为随访结局,例如:病人死于研究疾病。如果病人的随访结果是规定的结局,则称为失效或死亡(Failure),Survival time, Failure time, Waiting time)。通常用Ti表示(i=1,2,…,n, n为观察个体数)。 在随访中,由于客观条件限制,不能也不可能将全部观察对象都观察到规定的结局(Failure)。在观察截止时,一组观察对象除了出现规定的结局外,还有三种结果:(1)死于其他疾病;(2)由于迁移等原因失去联系(失访);(3)随访截止时尚未出现规定的结局。这三种结果虽原因不一,但提供的信息是一致的,这类病人不能获得确切的生存时间,而只知道其生存期比随访观察到的时间长的信息。我们将此类病例数据称为截尾(Censored)数据。其观察到的时间用Ci表示。 在获得生存时间时要注意以下几点: 1.随访结局可以不是死亡。随访的结局根据研究问题的性质和目的的不同可以是死亡、复发、恢复等。但要明确时间界线。例如:肿瘤病人已作了手术切除治疗,我们随访观察他有否复发,复发就是我们规定的结局。 2.确定进入随访观察的起点时间。随访研究中,无论是同时进入观察还是陆续进入观察,对所有对象都要规定某一事件作为进入观察起点事件。例如:病人确诊,治疗开始或手术时间,动物试验中染毒等,作为起点事件要有明确的时间界线。 3.时间尺度。医学研究一般用日历时间作为时间尺度。但在某些医学问题研究中,可能不以日历时间作为时间尺度更能反映所研究的问题。例如:对儿童龋齿出现的随访研究中常以儿童出到第几颗牙才出现龋齿作为时间尺度。 11.1.2生存数据的特征 生存数据在结构上有它自己的特点,主要表现为: 1. 生存时间数据的分布与常见的统计数据分布有明显不同,常呈指数分布、Weibull分布、对数正态分布、对数Logistic分布、Gamma分布或更为复杂的分布,生物医学中的生存时间分布有时呈现不规则状态,因而难以用传统的统计方法对这类数据进行处理。 2. 生存数据中往往包含有截尾数据。在随访研究中,若能观察到研究所规定的结局就能获得确切的生存时间,这类数据称为完全数据。但在实际工作中,由于时间和客观条件限制,部分患者难以观察到终点事件,以致不能获得确切的生存时间,而只能获得进入观察至失访时这段时间。在分析总结时若剔除这部分对象往往导致样本有偏性,并且这部分数据仍然提供了其实际生存时间大于观察到的截尾时间的信息,应充分利用这部分资料的信息。因此,一般随访研究的样本数据中不可避免地包含有截尾数据。 11.1.3生存时间函数 描述生存时间分布规律的函数主要有生存函数、死亡概率函数、概率密度函数和危险率函数。为了后文叙述方便,这里主要介绍生存函数和危险率函数。 1. 生存函数 在描述生存规律的数量指标中,以往常用的指标是某个特定时间的生存率(例如:3年生存率、5年生存率)。这一指标的主要缺陷为不能反映整个生存规律,一个理想的指标应该是任意时间的生存率,即生存率是任意时刻t的函数。其意义是研究个体生存时间长于t的概率。若令T为生存期,s(t)为任意时刻t的生存率,得 s(t)=p(T≥t) 0≤t∞ (11.1) 则称s(t)为生存率函数,简称生存函数。(Survivor Function)。 将s(t)对t在直角坐标系作图画出生存率曲线,可从图上粗略估计出中位生存期或半数生存期。即生存曲线上取生存率为50%时所对应的时间。 2. 危险率函数(Hazards Function) 如果我们考虑已活到t时刻的患者,在时间t附近的瞬间死亡危险性,

文档评论(0)

jyf123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6153235235000003

1亿VIP精品文档

相关文档