- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《癌症》ppt课件
癌症临床试验数据研究
王云云 20160602053
目录:
研究目的
数据介绍
描述性分析
模型分析:加速失效模型
COX等比例模型
1、研究目的
研究120个参与某临床试验的癌症病例,发现相关影响因素,并对比评估某新治疗方案的疗效(同标准治疗方案对比)
2、数据介绍
随机抽取某临床试验的120个病人
因变量(Y):该病人的生存时间(以天计)
同时数据还提供试验结束时病人的生存状态(C)
但生存的病人的真实生存时间(Z)未知,因此他们被记录的生存时间是被截断的
解释变量:治疗方案(X1):标准方案,新方案
癌细胞类型(X2):A,B,C,D
临床打分(X3)
年龄(X4)
变量处理:
1、对于试验结束时病人的生存状态(C),观察到的生存时(Y),
真实生存时间(Z),有如下关系:
C=0,仍然存活,则Z=Y;
C=1,已经死亡,则Z=Y
所以Z是一个被截断的数据
2、对于定性的解释变量,我们设定:
X1=0,标准方案;X1=1,新方案
X2=1,A;X2=2,B;X2=3,C;X2=4,D
3、描述性分析
首先,本数据总样本量为120,其中113位病人在观测期间内死亡,而剩下的7位病人的真实生存时间被截断,截断比例为5.83%,整个样本的生存数据如图:
从中可以看出,以中位数计,癌症病人的生存时间为100天左右,即3个月左右,这说明,我们的医疗方案对癌症病人的医治并不是很有效,需要进一步的改善和创新。
接下来,我们尝试按照各个解释变量分组,然后重新计算生存函数,并作对比分析
1、考虑因素X1(治疗方案)分组的生存函数:0—标准方案;1—新方案
从中可以看出,对于生存时间比较短(约150天以内)的病人,采用标准方案和新方案的病人生存时间差别很小,而对于存活时间较长(大于150天)的病人,采用新方案病人的生存时间明显高于采用标准方案的。所以,我们初步认为:新方案对于癌症早中期的病人更为有效,而对于晚期的病人并不是很有效
2、考虑因素X2(癌细胞类型)分组的生存函数:A,B,C,D
从中可以看出,对于存活时间比较短的癌症患者(晚期),A、D类的差别并不明显,但他们存活时间明显高于A、B类;而对于存活时间比较久的患者,不同癌细胞类型的病人生存时间差距较大,其存活时间由多到少一次是:A—D—B—C;因此,我们初步认为:A类癌细胞更容易被控制,而C类则很难被有效的控制。
3、考虑因素X3(临床打分)分组的生存函数:
因为是连续型数据,我们通过对其进行大致的分组来进行讨论,
M1=1,如果 -50X3=-20;
M1=2,如果 -20X3=20;
M1=3,如果 20X3=50;
从中可以看出,临床打分与癌症病人的生存时间之间有着很明显的正相关关系,即打分越高的患者,其生存时间越长。图中很明显:打分在20~50之间的,生存时间最久,-50~-20之间的,生存时间最短,而在-20~20之间的,出于两者之间。
3、考虑因素X4(年龄)分组的生存函数:连续数据,所以我们
照类似的方法对其进行分组后进行讨论
M2=1,如果 20X4=30;
M2=2,如果 30X4=40;
M2=3,如果 40X4=50;
M2=3,如果 40X4=50;
从中可以看出,我们有四个分组,但最终得到的分组生存函数图中只有3条函数图,这是因为年龄出于20~30之间的只有2个样本,不能反应出函数关系,因为我们所得的数据为随机抽样数据,所以我们认为年龄处于这个区域的人患癌症的概率很低;而对于其他3个分组的生存函数图,我们可以看出,对于存活时间很短的患者,三个年龄段差别并不大,而对于存活时间越长的患者,年龄处于40~50之间的生存时间最长,30~40之间的次之,而处于50~60之间的最短。
通过先前对数据简单的描述性分析,我们对各自变量与生存时间之间的相关关系有了初步的了解,但如果要更明确的分析他们之间的具体关系,我们需要建立相应的数学模型,这里,根据数据特征,我们将选用生存回归来进行模型拟合。
4、模型分析
首先通过加速失效模型进行分析
1、全模型分析结果
从全模型的分析结果可以看出,解释变量X1(治疗方案)、X4(年龄)并未通过显著性检验,所以这样得到的模型并非最优模型。
2、根据AIC准则搜索最优模型:
根据AIC准则所得到的最优模型,可以看出,它剔除了变量X1、X4,所以剩余的相关解释变量只有X2(癌细胞类型)、X3(临床打分)与因变量相关;对于X2(癌细胞类型)
文档评论(0)