- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生存分析中时间变量的选择.pdf
中国人口科学 2009 年第6 期
生存分析中时间变量的选择
李 强 张 震
【摘 要】文章对使用生存分析技术分析左截平数据时如何选择时间变量
进行了探讨。作者从理论上、逻辑上、似然函数的构造、协变量系数的估计及模
型对数据的拟合度方面指出,以真正的历险时间(如年龄)为时间变量是正确
的模型表达,而以观测期为时间变量的模型表达是错误的,用中国高龄老人死
亡风险的研究例示了这一结论。并指出在特定的情况下,两个模型对协变量的
估计比较接近,研究者应该准确把握所研究事件的特点,选择正确的时间变
量,从而正确表达风险函数和构建似然函数,准确地估计模型的各个参数。
【关键词】生存分析 左截平 时间变量 纵向追踪调查数据 等比例风
险模型
【作 者】李 强 德国马普人口研究所,研究员;张 震 德国马普人口研
究所,研究员。
①
鉴于在研究因果关系方面具有的独特优势,生存分析或事件史分析 被广泛地应用到
医学、流行病学、社会学、人口学、精算学等许多领域(郭志刚,2001 ;Klein 等,2003 ;Aalen
等,2008)。近 10 多年来,随着国内长期跟踪调查数据的日渐丰富,这一分析方法也越来越
多地见诸于中国的人口学、社会学和流行病学等领域的研究。生存分析的广泛应用还得益
于分析手段的改进。20 世纪90 年代以来,几个主流统计分析软件(S- plus/R 、SAS、STATA、
SPSS 等)相继提供了生存分析(和事件史分析)的功能模块,并不断把新近的理论进展整合
到这些模块中。这极大地降低了使用生存分析的技术“门槛”,由此研究者可以把精力集中
在所关注领域的理论思考上,而无需在统计技术上耗费太多的时间。然而,这种易用性也使
得一些生存分析的基本原理和重要的技术细节被或多或少地忽略了。生存分析中时间变量
的选择就是这些被忽略的内容之一。
生存分析研究的是事件发生概率随着历险时间变化的规律,准确地度量历险时间、正
确地选择时间变量是生存分析最基本也是最重要的内容之一。对于一些研究来说,时间变
① 生存分析与事件史分析并无本质的区别,只是针对不同的研究对象进行的区分,通常对只能发生
一次的事件(比如死亡)的研究称为生存分析,而把可能发生多次的事件(如婚姻、生育等)的研究
称为事件史分析。为行文简洁,我们在不会引起混淆的情况下使用生存分析来指称这一类研究。
88
生存分析中时间变量的选择
量的选择不会存在歧义。 比如,在研究果蝇的死亡率时,我们观测一批新出生的果蝇,直到
这些果蝇全部死亡。因为观测期起点与果蝇的死亡历险时间的起点相一致,在这种情况下,
无论时间变量是用年龄还是观测期,得到的分析结果都是一样的。然而,在其他一些以人为
对象的研究中,特别是在很多长期纵向追踪数据中,被调查对象通常从某一时刻开始才进
入我们的观测视野,这个观测的起点可以是某个特定的时间(如2000 年7 月 1 日),也可以
是被调查者符合某种条件(如年龄达到 80 岁),或是经历了某一事件(如初婚或某种疾病的
发生),即生存分析中所谓的左截平(Klein 等,2003)。在随后的观测中,被调查对象可能经历
某事件或者未经历该事件(即删截)。在这种情况下,观测期与事件历险时间可能会不一致,
时间变量的选择就变得比较复杂。比如,我们追踪调查了一批80 岁以上的高龄老人的健康
长寿状况,当研究他们的死亡风险时,就有两种不同的时间变量:一是年龄;二是观测期。
我们知道,人从一出生就开始面临着死亡风险,而不是从被调查(这里指80 岁及以上)才开
文档评论(0)