生存分析知识总结生存分析知识总结.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生存分析知识总结生存分析知识总结

生存分析知识总结 一、生存分析的基本概念 生存分析是将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计规律的分析与推断方法的学科。 生存时间也叫寿命、存活时间、失效时间等等。比如:医学上包括疾病发生时间、治疗后疾病复发时间;可靠性工程系为元件或系统失效时间;犯罪学方面是重罪犯人的假释时间;社会学上指首次婚姻持续时间;人口学上包括母乳喂养新生儿断奶时间;经济学包括经济危机爆发时间、发行债券的违约时间;保险精算学包括保险人的索赔时间、保险公司某一索赔中所付保费;汽车工业包括汽车车轮转数;市场学中有报纸和杂志的篇幅和订阅费。这些也可以说明,生存时间可以不是具体的时间。 二、生存分析的历史 生存分析方法最早可上溯至十九世纪的死亡寿命表。现代的生存分析则开始于二十世纪三十年代工业科学中的相关应用。 二次世界大战时期,武器装备的可靠性研究,这一研究兴趣延续到战后。此时生存分析都集中在参数模型。二十世纪六七十年代,医学研究中大量临床试验的出现,要求方法学有新的突破,导致了生存分析的研究开始转向非参数方法。D.R. Cox在72年提出的比例风险模型为此做出了划时代的贡献。 现在,生存分析方法的在医学领域得到了广泛的应用,而通过医学研究要求的不断提高,这一方法也得到了飞速的发展。 三、生存分析的研究目的,内容和具体方法 (一)研究目的主要由以下五个方面 1.描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。 2.比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。统计方法log-rank检验等。 3.影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。 4.统计方法Cox比例风险回归模型等。 5.预测:建立Cox回归预测模型。 (二)主要研究内容 描述生存过程 研究人群生存状态的规律 研究生存率曲线的变动趋势 是人寿保险业的基础 生存过程影响因素分析及结局预测 识别与反应、生存及疾病等相关风险因素 预测生存结局 在临床中应用的非常广泛 (三)主要分析方法 1.参数法方法:首先要求观察的生存时间t 服从某一特定的分布,采用估计分布中参数的方法获得生存率的估计值。生存时间的分布可能为指数分布、Weibull分布、对数正态分布等,这些分布曲线都有相应的生存率函数形式。只需求得相应参数的估计值,即可获得生存率的估计值和生存曲线。 2.非参数方法:实际工作中,多数生存时间的分布不符合上述所指的分布,就不宜用参数法进行分析,应当用非参数法。这类方法的检验假设与以往所学的非参数法一样,假设两组或多组的总体生存率曲线分布相同,而不论总体的分布形式和参数如何。 非参数法是随访资料的常用分析方法。 3.半参数方法:只规定了影响因素和生存状况间的关系,但是没有对时间(和风险函数)的分布情况加以限定。这种方法主要用于分析生存率的影响因素,属多因素分析方法,其典型方法是Cox比例风险模型。 生存分析的典型的统计软件主要有SAS、SPSS、Stata、Excel、R。 四、生存分析数据的数据类型 (一)完全数据 每个个体确切的生产时间都是知道的。这样的数据称为完全数据。但在实际的生存分析中,数据在很多情况下是很难完全观察到的。 (二)删失 生存数据一个重要的特点是:在研究结束时,无法获得某些个体确切的生存时间。例如: 失去联系(病人搬走,电话号码改变);无法观察到结局(死于其他原因);研究截止,个体仍然存活;获得的数据就是删失数据;对存在删失的个体,只知道删失时间。 删失分为右删失、左删失和区间删失 1.右删失是指,在进行观察或调查时,一个个体的确切生存时间不知道,而只知道其生存时间大于时间L,则称该个体的生存时间在L上是右删失的,并称L为右删失数据。 右删失有三种类型(按结束时间差别): I型删失 对所有个体的观察停止在一个固定的时间,这种删失即为I型删失(或定时删失)。 例如:动物研究通常是以有固定数目的动物接受一

文档评论(0)

cduutang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档