网站大量收购闲置独家精品文档,联系QQ:2885784924

肿瘤流行病学研究资料统计分析.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
肿瘤流行病学研究资料统计分析

肿瘤流行病学研究资料的统计分析 项永兵 第四讲 生存资料单变量分析中危险率比估计   Logrank检验[1,2]是生存分析中最常用的非参数统计方法。在资料分析时,除计算假设检验统计量及相应P值外,还可以对研究因素的效应做出估计,即估计一些参数或指标,例如回归系数β或相对危险度RR。单因素分析中常用的参数是相对危险度(RR)。在生存分析中该术语经常被称为危险率比(harzard ratio,HR)。国人在生存资料单因素分析的结果中仅报道假设检验统计量及P值,很少给出RR或HR的估计值,一般在Cox回归模型分析中列出它们的结果。所以如何在单变量分析情形下,基于logrank检验估计RR或HR,是本讲的主要内容。   一、统计方法:以最常见的二元协变量为例,即两组比较的情形。假定两组个体在时刻t时的危险率分别为λ1(t)和λ2(t),根据Cox的比例危险假设[1,2],存在下式 式中HR即危险率比。它不依???于时间,是个常数。回到上一讲(第三讲)中关于样本资料的一些假定,例如2×2表,这里不在重复,请参考。首先看无效假设,即H0∶HR=1。而假设检验统计量则是常用的logrank检验统计量,分别有Mantel和Peto氏统计量两种。即为上一讲中的公式(5)和(4)。为了叙述上的方便,这里重复这两个公式。Mantel氏统计量[1~7]和Peto氏统计量[1~5,8~11]分别为 其中Peto氏(简化式)统计量比Mantel氏统计量在假设检验上较保守[1,2,10~12]。在(2)式的基础上,估计危险率比的公式[8]为 式中分子为实际死亡数与期望死亡数的差,分母为方差。期望死亡数与方差的计算方法见上一讲。对数危险率比log(HR)的方差估计可以用下式 而与(3)式相对应的危险率比估计公式[9,14,15]为 上式分母中的期望死亡数除可用上一讲中的方法计算外,还可用下式 对数HR2的方差估计公式[2]为 或采用下式[1] Vrlog(HR2)=1/W ,(8) 式中 估计HR方差的目的,是为了能估计HR的95%置信区间(CI),或做假设检验。   二、实例说明:以Freireich白血病临床试验数据[1,2,16]为例,资料见表1。研究因素是治疗方法,即对照组(安慰剂组)和6-MP治疗组,也即两组比较的情形。目的是比较两组病人的生存期(预后)有没有差别,或者为了说明采用6-MP药物治疗的病人,其预后是否优于对照组。本文的重点在于估计研究因素的效应大小,即危险率比HR。表2是分析该数据的假设检验统计量、危险率比及其对数的方差估计值等。为了与Cox回归模型[1,2]的分析进行对比,表中同时给出Cox回归模型的分析结果。以logrank检验为例,对照组相对于治疗组的危险率比为5.15,且有高度统计学意义。表中的结果同时也说明了简化式统计量是较保守的。与Cox方法相比,基于logrank检验的参数估计值HR似有高估的倾向,而在简化式基础上推导的参数HR则低估。 表1 Freieich白血病临床试验病人随访资料 (对照组和6-MP治疗组) 对照组:1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15, 17,22,23试验组:6,6,6,6+,7,9+,10+,10+,11+,13,16,17+, 19+,20+,22,23,25+,32+,32+,34+,35+   注:生存时间单位为周;“+”表示截尾生存时间(censoring times)。 表2 假设检验统计量及危险率比估计值 方 法统计量P值RVr[log(R)]Mantel氏logrank 16.790.0000425.150.1598Peto氏(简化式)15.230.0000954.180.1450Cox15.93*0.0000704.52- 15.210.000100   *:Cox比分统计量;:似然比统计量。   为了对上述两种相对危险度的估计方法做出评价及说明它们的偏性大小,笔者利用计算机进行了模拟研究。生存时间以指数分布为例。具体做法见表3。除考查样本大小的作用以外,其它情况均是产生一个含量为1 000的随机样本。其中因素效应的大小以参数β的大小来表示。需要说明的是括号内其它条件中的0.4为β;50为指数分布(生存时间)的均数;25%为截尾数据所占比例大小。结果如下:   1.样本大小:随着样本含量增加,危险率比的估计越来越稳定,偏性也越小。而不同的估计值之间却相差极小,说明不同的方法不受样本含量的影响。   2.截尾数据比例:随着截尾数据所占的比例增加,危险率比的估计似出现越来越不稳定的趋势。但不同的估计方法似乎受其影响较小。   3.因素效应

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档