- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
变点问题在生存分析中应用综述
变点问题在生存分析中应用综述
作者简介:周杏杏(1989-),女,汉族, 山东济南人,在读研究生,浙江财经大学,研究方向: 变点问题、生存分析。摘要:变点问题在医学研究、保险精算以及可靠性控制中有着及其重要的应用,而这类数据的研究问题都属于生存数据的研究范畴。本文根据变点模型的研究现状,分别讨论了单发事件和复发事件的变点问题,并对复发事件分别关于实际事件数据和面板数据这两类数据进行综述。由于复发事件数据的存在更具广泛性,且对复发事件变点问题的建模和参数估计研究涉及到的文献非常少,本文对两类复发事件数据的综述又分为有变点和无变点的情形。最后得出结论,给出可做的后续工作。
关键词:变点;复发事件;协变量;删失;最大似然估计
引言
变点问题(change point problem)一直是统计学中非常热门的研究方向,变点反映事物的某种质的变化,在各种领域常见且具有重要性。变点问题的研究是分析突发事件对模型影响的关键之一,可作为研究气候突变、灾异事件、股市波动预测、改革之成效以及新型药物、治疗方案的疗效等的重要工具。进一步,变点问题在医学研究、保险精算以及可靠性控制中有着及其重要的应用,而这类数据的研究问题都属于生存数据的研究范畴。
生存分析(survival analysis)是研究既有事件的发生时间又有事件结局资料的统计学方法,与一般统计数据不同的是,它强调所研究问题的结果变量是某一事件发生的时间,通常用来分析生存时间和事件与众多影响因素之间的关系及其程度大小。
随着生存分析的方法被广泛应用到医学研究领域,如现场追踪研究、临床疗效试验、疾病预后分析等,生存时间(survival time)的涵义也随之扩展到更广义的范围。由最初事件的失效时间(failure time)(属单发事件数据)推广到事件发生多次的时间(属复发事件数据)。而复发事件数据广泛地出现在诸如生物、医学试验和公共健康的数据分析,工业和商业经济数据分析,可靠性、社会科学和保险精算等的研究中,最近二十年,对复发事件数据的研究受到了广泛的重视,也得到了很快的发展。所谓复发事件数据(recurrent event data)是指对一些个体进行观察,某些我们感兴趣的事件重复发生的时间点、时间间隔、累积次数等所组成的数据,如观测一些人群在某一段时间内住院的次数以及相应的医疗费用,艾滋病毒感染者的疾病复发次数,在保险精算中的个体事故理赔次数以及相应的理赔额度等。这类数据不同于单发时间数据,因为事件重复发生的时间是有顺序的,并且具有相依性,同时由于删失时间的存在,以及删失时间可能与事件发生的累积次数具有相依性,使得对复发事件数据的分析、建模及统计推断具有更大的挑战性。
本文结构如下:第二部分对单发事件的变点估计问题进行综述;第三部分对复发事件的相关研究进行综述;第四部分得出结论,分析后续工作。
1. 单发事件的变点估计
关于生存数据的变点问题建模国内外的研究起步较晚,文献也不多。Matthews和Farewell[1]建立了最基础的生存数据风险函数分段常数单变点模型:,检验了内科医生为缓解白血病人的症状而使用一种新的治疗方案之后,能否改变白血病的复发时间这一问题。这一假设检验问题实际上就转变为检验风险函数是否存在变化的问题。这篇关于生存数据变点的文章,引发了人们对这类问题的研究兴趣,发现了研究变点问题对于生存分析的重大意义。它与传统的变点问题有相似之处,但又有很大的区别,有其特殊的理论和实际意义。
Chang,Chen和 Hsiung[2]提出了首先采用Nelson-Aalen非参数估计来估计变点,然后再使用极大似然函数来估计参数,并考虑了生存数据的删失性,结合非参数和参数方法来提高变点和参数估计的精度。
Dupuy[3,4]将常数单变点模型进行了推广,加入了协变量对生存数据的影响,同时考虑了数据的删失,提出了变点和参数的极大似然估计,并进行了假设检验。
Zhao,Wu和Zhou[5]首先考虑了含有持久生存数据的单变点风险函数模型,采用Kaplan-Meier估计,结合Chang,Chen和 Hsiung[2]的Nelson-Aalen非参数估计和极大似然参数估计来给出变点和参数估计,并证明了估计的相合性。以上这些研究都只是围绕风险函数的单变点模型进行讨论,对多变点模型的分析非常少。
2. 复发事件的变点问题
以上研究主要集中于生存分析中单发事件数据的变点问题建模及分析,由于复发事件数据的存在更具广泛性,最近二十年,对复发事件数据的研究受到了广泛的重视,也得到了很快的发展。复发事件数据可以分为两类,一类是实际事件数据,需要已知每次事件的具体时间;第二类是面板计数数据,只需已知事件时间所在区间即可。
原创力文档


文档评论(0)