COX回归模型的样本含量的计算方法及软件实现论文.docVIP

COX回归模型的样本含量的计算方法及软件实现论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
COX回归模型的样本含量的计算方法及软件实现论文.doc

  COX回归模型的样本含量的计算方法及软件实现论文 【摘要】 目前生存分析中COX回归模型到底需要多少样本量往往靠经验法来估计。旨在介绍并推广生存分析中COX回归模型所需样本量的计算公式及其目前可以实现该计算方法的软件,并通过实例说明了该公式的应用,以期提高今后研究工作的效率。 【关键词】 生存分析; COX回归模型; 样本量; 统计软件 COX回归模型在生存分析中应用非常广泛,然而,关于应用该模型到底需要多少样本含量的问题一直未得到很好地解决。主要原因就是生存分析中往往涉及到数据删失的问题,如果不考虑删失数据,则可以利用率的比较所需样本量的计算公式。但是,简单的忽略这部分数据.freeletrics杂志上撰文,提出了一个计算比例风险模型样本含量的公式[1,2]: D=(Z1-α+Zβ)2[P(1-P)logΔ)2]-1 这里,D是指发生阳性结局的总人数,P是指分配到第一治疗组人数所占的比例。logΔ是指风险比的对数。该公式主要是用来计算随机化分组研究的设计所需的样本量,适用于二分类自变量。同时,当考虑其他协变量对生存时间的影响时,则要求主要感兴趣的研究变量与其他变量间相互独立。 然而,在实际的工作当中,变量之间有时并不能满足独立性。因此,2000年,Hsieh和Lavori在Controlled Clinical Trials上将Schoenfeld的计算公式进行了扩展[3],现介绍如下: N=(Z1-α/2+Z1-β)2P(1-R2)σ2B2 等号左边,N表示所需要的样本含量。 等号右边Z1-α/2,Zβ表示给定检验水准和检验功效时的z界值;P表示整个研究期间阳性结局事件的发生率;B表示对数风险比,即logΔ;σ2表示感兴趣的研究因素X1的方差,这里假定X1服从正态分布,对于非正态分布的X1,如二项分布,可通过p(1-p)进行估计,这里,p表示X1取“0”或“1”的比例。与Schoenfeld的计算公式不同的是,该公式引入了“方差膨胀因子”(VIF),即1/(1-R2)。R2表示X1对其他协变量作回归分析时的确定系数,取值范围0~1,当取值为“0”时,一般表示只考虑一个自变量X1的情形。亦即当变量间不满足独立性时,需要通过VIF来增加参数估计值的方差。 上述各指标可通过查阅相关文献或进行预试验确定。 2 软件实现 目前,有许多统计软件可以用来计算生存分析所需的样本量,但是大部分软件都是针对logrank检验的,或是要求生存时间服从指数分布,比如Splus、PS、NQuery Advisor、STATA、PASS等。然而,逐渐地也有不少软件开始引入针对COX回归分析所需样本量的计算程序,比如STATA和PASS。现介绍如下: 2.1 STATA软件的应用 程序如下:stpolist):检验水准,默认0.05; * polist):检验效能,默认0.8; * onesided:单侧检验,默认双侧检验; * sd(#) :感兴趣的研究因素X1的标准差,默认0.5; * r2(#) :确定系数,默认0; * failprob(#):阳性结局事件发生率,默认100%。 2.2 PASS软件的应用 PASS是NCSS软件中执行检验功效分析和计算样本量大小的一个功能模块。操作步骤如下: ① 打开NCSS软件,进入类似SPSS的操作界面; ② 点击PASS下拉菜单,选择“survival and reliability”子菜单,选择“COX regression”,进入相关参数设置对话框; ③ 设置相关参数,点击工具栏“play”,完成操作。 3 实例应用 Krall, Uthoff and Harley (1975)研究了65例多发性骨髓瘤患者预后的影响因素,一共9个变量(具体数据参见sas phreg过程中的数据集Myeloma)。如研究者主要感兴趣的变量为X1(logBUN),预估计其对数风险比logΔ=1,研究结束时死亡率P=48/65=73.8%,按照单侧0.05的检验水准和预期80%的检验效能,估计所需的样本量的计算过程如下: ① 估计X1的标准差,得σ=0.3126; ② 对X1和其他协变量作多重线性回归分析,得R2=0.1839; ③ 利用STATA或PASS软件,将上述参数带入计算,得样本含量N=107。 按照Hsieh和Lavori所提供的公式,若要达到80%的检验效能,估计所需的样本量为107例。故对于该项研究而言,若只研究65例患者,则需慎重对待所得结论。 4 讨论 本研究中提到的公式,有效地解决了在生存分析中广泛应用的COX回归模型的样本含量的计算问题,为医学科研工作者

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档