网站大量收购闲置独家精品文档,联系QQ:2885784924

如何用SPSS做生存分析(TCGA数据举例).pdf

如何用SPSS做生存分析(TCGA数据举例).pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
如何用SPSS做生存分析(TCGA数据举例)--第1页 如何用SPSS做生存分析(TCGA数据举例) 生存分析是评价疾病预后的一个重要分析方法,尤其是在肿瘤研 究中。之前我们介绍过好几个肿瘤生存分析的在线工具,比如 KM plotter ,Onclnc ,GEPIA 等等(生存分析,这个网站还不错!,懒人 怎么做肿瘤病人的生存分析?)。有童鞋反映说这几个工具分析出来 的结果咋不一样呢? 原因主要有: 1、在线工具的数据样本来源不同,大致上是 KM plotter (TCGA 数据 +GEO 数据) GEPIA (TCGA 数据) Onlnc (部分TCGA 数据) 2、分析时样本剔除的标准有所不同。 此外,在线工具分析的结果你无法得到入选分析样本的临床数据, 也无法得到下图这样分类更加详细的生存分析结果。 (硕士论文:浙江省常见恶性肿瘤生存分析) 所以有的时候还是得自己亲自动手做不做生存分析,今天就给大 家介绍一下如何用 SPSS 分析对 TCGA 数据库中的肿瘤(肺腺癌)数据 进行生存分析。(SPSS 版本是 16.0 的,还是英文的,从一个留学的 同学那拷来的,一直没换,大家将就着看吧) 首先是下载 TCGA 的临床数据和测序数据(FPKM 数据),这一 步可以用简易 TCGA 下载工具这个小工具来处理(这么好用的 TCGA 数据下载工具?!)。 得到临床数据后,我们需要得到 Over survival (OS )的数据,如 果病人死亡了, OS 就等于 days to death ,如果还活着,那就等于 days to last followup。而没有数据的病例就是我们需要剔除的条目了。 得到 OS 的数据之后,我们可以选择不同的临床信息进行生存分析, 比如 TNM 分级,吸烟与否,治疗方式等等。 如何用SPSS做生存分析(TCGA数据举例)--第1页 如何用SPSS做生存分析(TCGA数据举例)--第2页 我们以抽烟为例,No Availale 为不抽烟病例,其他为抽烟的病 例。 根据存活与否排序,得到OS的数据,再根据OS排序,删除没有 生存信息的数据 再看下吸烟情况,不吸烟的人似乎有点少,看来得肺腺癌的还是 吸烟的多啊。。。 考虑到“节目效果”,这里把吸烟史=1的也归到不吸烟组。 向SPSS导入数据时,个人习惯先把EXCEL复制成TXT文本文件 再导入(出错情况较少)。 选择数据包含标题 分隔符只选Tab制表符,Space空格勾掉不选。 其它设置默认即可。 分析类型选择生存分析,使用Kaplan-Meier法 设置如下 结果表明,生存分析结果表明吸烟组和非吸烟组并没有什么显著 差异。 前面我们还下载了基因表达数据,在临床数据中我们将 barcode 这列数据和表达数据中的样本编号对应起来(用vlookup函数) 注意表达数据中的样本编号后面有-01的标识,这表示这是癌组织 的样本,所以作上述对应操作时把-01都删掉。随后按基因表达量排序, 一半标记为up,一半标记为down即可。 样本信息处理好之后,依照前面的方法进行生存分析即可。 如何用SPSS做生存分析(TCGA数据举例)--第2页

您可能关注的文档

文档评论(0)

. + 关注
官方认证
内容提供者

专注于职业教育考试,学历提升。

版权声明书
用户编号:8032132030000054
认证主体社旗县清显文具店
IP属地河南
统一社会信用代码/组织机构代码
92411327MA45REK87Q

1亿VIP精品文档

相关文档