- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * (10号) 21160311055 侯笛 目录 1 概述 2 常用术语 3 分析方法 4 案例分析 概述 定义 生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。由于最初研究的关键事件是死亡,故称为生存分析。生存分析是统计科学的重要分支,其研究的两个重要变元为“事件”和“寿命”。 事件:生存分析中定义的事件有死亡、损坏、失败、解雇、病发等等。例如病人的死亡,产品的失效,疾病的发生,职员被解雇。 寿命:从记录开始到事件发生的时间。 特点 生存分析的优点在于其能够处理删失数据。 生存分析的统计资料以生存时间为反应变量,此类资料的生存时间变量大多不服从正态分布,且由于删失值的存在,不适合用传统的分析方法处理。此时就应选用生存分析的方法。 研究内容 生存分析研究的内容主要有以下两个方面: 一 对生存过程的描述 二 分析生存过程的影响因素并对生存的结局加以预测 应用领域 生存分析虽然源自医学领域,但其在生物学,保险学,可靠性工程学,经济学,教育学,社会学等领域都有广泛的应用。比如: 医疗科学中病人的去世 保险行业中的赔偿 可靠性工程中产品的失效 金融领域中银行账户从开立到取消的时间的研究 教育行业中学生的中途退学 客户关系管理中的客户流失 常用术语 生存数据 生存分析中所分析的数据通常称为分析数据,一般度量的是某个事件发生所经历的时间长度。生存数据可以分为完全数据和删失数据。 完全数据:指提供了完整信息的数据。例如,在研究产品的失效时间时,某个样品从进入研究直到失效都在我们的观察中,可以得到该样品的具体失效时间,这就是一个完全数据。 删失数据:是指在观测期内,我们并没有看见个体的状态发生改变,无法确定个体具体的生存时间。又分为左删失数据,右删失数据,区间删失数据。 A B C D E 删失数据示意图 起始 观测时间区间 终止 死亡 死亡 死亡 未知 退出 完全数据: A,观测期内死亡 右删失数据: B,观测未终止时因故退出 C,观测终止时尚未死亡 左删失数据: D,死亡时间在某一时刻之前,具体时间未知 区间删失数据: E,死亡时间位于某一区间,具体时间未知 生存函数 生存函数(survival function),又称为累积生存率,我们用符号T表示个体的生存时间(从开始记录到事件发生的时间),用 t 表示观测时间,将生存函数记作 S(t),是指个体生存时间大于 t 的概率。 S(t)= P(T> t ),显然 S(t)是非升函数,且S(0)= 1, S(∞)= 0, 风险函数 风险函数(hazard function),又称为瞬时死亡率,记作 h(t)。是指在t时刻存活的个体,在t+? t 时刻死亡的概率。 显然,h(t)非负,且无上限。 分析方法 按照是否使用参数,可以将生存分析中的分析方法分为三类: 参数方法:若已经证明某事件的发展可以用某个参数模型很好地拟合,就可以用参数方法做该事件的生存分析。常用的参数模型有指数分布模型、对数分布模型、正态分布模型,威泊分布模型等。 非参数方法:当被研究事件不能被参数模型很好地拟合时,可以采用非参数方法研究它的生存特征。常用的非参数方法包括生命表分析和K-M分析。 半参数方法:它比参数模型灵活,与非参数方法相比更容易对分析结果进行解释。生存分析中使用的半参数模型是Cox比例风险模型。 非参数方法 生命表分析 K-M分析 生命表分析 生命表分析将观测时间分成时间段,按时间段逐个统计事件发生的情况,以此估计生存函数。假设共有k个时间段 [ t 0 , t 1) , [ t 1 , t 2) , … , [ t k-1 , t k ) , 每个区间中事件发生的次数分别为 d 1 ,d 2 ,… , d k , 每个区间中的个体总数分别为 n 1 , n 2 ,… , n k ,所以在第 i 个区间个体存活的概率为(n i - d i )/ n i ,而个体可以从第一个区间存活到第 i 个区间的概率(累积生存率)为: i = 1 , 2 ,… ,k ,且S(t)为递减函数。 K-M分析 Kaplan-Meier分析,也称为乘积极限分析,是Kaplan和Meier在1958年提出的一种估计生存函数的非参数方法。与生命表分析不同,K-M分析以事件发生的时间点将观测区间分段,用来估计生存函数。下举例说明其具体的分
原创力文档


文档评论(0)