生存分析和COX回归.pdf

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十八章 生存分析和COX回归 上海第二医科大学 生物统计教研室 第一节 基本概念 • 在医学,生物学研究中,常用到生存 分析 (Survival Analysis)方法。例如 对于肿瘤等疾病的疗效及预后的考核,通 常不用治愈率,有效率等表示,而用将 来复发或死亡的时间长短表示,也即生存 期来表示。 • 所谓生存期(survival time)是指 从某个标准时刻(如发病,确诊,开始治疗 或进行手术的时间)算起至死亡或复发为 止的时间。 生存期不同于一般指标的二个特点: 1.有截尾数据(censored data) 随访中未能知道病人的确切生存时间,只知 道病人的生存时间大于某时间。 (1)病人失访或因其他原因而死亡失访 (2)到了研究的终止期病人尚未死亡终访 + + 截尾数据可记为t ,如: 4 = 生存时间大于4年。 虽然截尾数据提供的信息是不完全的,但不 能删去,因为这不仅损失了资料,而且会造成偏 性。 2. 生存期的资料一般不服从正态分布。 由于上述原因,常用的统计方法不适用,而 要用特殊的统计方法。 生存分析是指对于生存期这一指标进行分析 的一系列特殊的统计方法。 • 生存时间不一定专用于死与活的情况,生存时 间(存活时间)可定义为从某种起始事件到达某终点 事件所经历的时间跨度。例如急性白血病病人从治 疗开始到复发为止之间的缓解期;冠心病病人在两 次发作之间的时间间隔;已作输卵管结扎的妇女从 施行输卵管吻合手术后至受孕的时间间隔;在流行 病学研究中,从开始接触危险因素到发病所经历的 时间等都可作为生存时间用作生存分析。 • 有时还收集一些有关因素 (称为自变量或协变 量), 以分析这些协变量是否对生存时间有影响,影 响的大小,是缩短或延长生存时间。这可以通过 Cox回归进行分析,因此,Cox 回归可看成带有协变 量的生存分析。 随访资料的记录: • 包括: • (1)开始观察日期,终止观察日期生存时间 • (2)结局(最终的观察到的是死亡还是存活) • 死于该病完全数据 • 存活或死于其他原因截尾数据 • 每个生存期数据要用2个变量表示:观察到的 生存时间和是否截尾(如:用1表示截尾,用0 + 表示死亡;4 用4,1表示;4用4,0表示)。 • (3)协变量各种影响生存期长短的因素。 第二节 描述生存时间分布规律的函数 • 一. 生存率(Survival Rate) • 又称为生存概率或生存函数,它表示一个 病人的生存时间长于时间t的概率,用S(t) 表 示: s(t)=P (Tt) • 如5年生存率: s(5)=P (T5) • 以时间t为横坐标,S(t)为纵坐标所作的曲 线称为生存率曲线, 它是一条下降的曲线,下 降的坡度越陡,表示生存率越低或生存时间越 短,其斜率表示死亡速率。 • §1.2 概率密度函数 • (Probability Density Function) • 简称为密度函数,记为f(t),其定义为: • f(t)=lim (一个病人在区间(t,t+△t)内死亡 概率/△t) • 它表示死亡速率的大小。如以t为横坐,f(t) 为纵坐标作出的曲线称为密度曲线,由曲线上可看 出不同时间的死亡速率及死亡高峰时间。纵坐标 越大,其死亡速率越高,如曲线呈现单调下降,则死 亡速率越来越小,如呈现峰值,则为死亡高峰。 • §1.3 风险函数 (Hazard Function) • 用h(t)表示,其定义为: •

文档评论(0)

xina171127 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档