TCGA甲基化和基因相关性分析.pptx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
TCGA甲基化和基因相关性分析 目录 1 TCGA表达数据下载 2 mRNA数据整理 3 相关性分析 4 生存分析 TCGA基因表达数据下载 PART 01 TCGA甲基化和基因相关性分析 下载方式和甲基化数据下载方式类似,在TCGA数据库中选择相应的数据类型,疾病类型,然后加入cart中。 「 」 TCGA甲基化和基因相关性分析 mRNA数据下载,需要下载manifest文件,meta文件以及cart文件。可以直接下载,不需要用TCGA的下载工具。 mRNA数据整理 PART 02 TCGA甲基化和基因相关性分析 将下载的cart压缩文件解压到当前文件夹,并将putFilesToOneDir.pl脚本放到同一个文件夹里,这个脚本能将解压出的所有文件夹里的文件整合到一个文件夹中。 TCGA甲基化和基因相关性分析 通过cmd的方式运行这个脚本。运行结束后,在文件夹中会自动生成一个新的文件夹,名字为files。 TCGA甲基化和基因相关性分析 新生成的文件夹中,就包括了前面解压出的每个文件夹里的压缩包文件。然后将所有的压缩包解压到当前文件夹(建议不要使用360压缩,因为360压缩过程中可能会出错)。 TCGA甲基化和基因相关性分析 将files文件夹剪切回子目录,然后使用mRNA_merge.pl脚本,进行表达文件的数据整合。运行完成后,在文件夹中会生成一个mRNAmatrix的txt文件。同时,会给出所整合的数据中正常样本和肿瘤样本的数目。 TCGA甲基化和基因相关性分析 mRNAmatrix文件就包括样本信息及基因表达信息,但是这时候它的基因ID还是ENSG号。需要进行ID转换,便于后续分析。 TCGA甲基化和基因相关性分析 ID转换需要ID注释文件(huma.gtf),然后在cmd中运行getMrna脚本。运行完成后,在文件夹中会生成一个symbol文件。随后,对这个文件进行标准化处理,即可以获得标准化后的mRNA表达文件。 TCGA甲基化和基因相关性分析 采用edgeR脚本进行分析,这个脚本和之前TARGET数据库的差异分析脚本是同一个,在进行差异分析的同时,进行数据的标准化。运行结束后,在文件夹会生层一个normalizeExp文件,就是标准化后的表达文件。 相关性分析 PART 3 TCGA甲基化和基因相关性分析 首先对标准化后的甲基化数据和基因表达数据进行合并。直接通过R语言merge脚本进行合并。 TCGA甲基化和基因相关性分析 运行脚本,修改路径,运行完成后会重新生成一个merge.txt文件,这个文件就整合了甲基化和表达数据的文件。 TCGA甲基化和基因相关性分析 在merge文件中,会对每个基因的表达数据来源进行标记,在基因后面带有methy的,即来自于甲基化文件,有exp的,即来自于表达文件。 TCGA甲基化和基因相关性分析 获得合并后的文件后,就可以记性甲基化和表达关系相关性分析了。在脚本中设定基因名称和路径,然后直接运行,最终会给出一个相关性图片。 TCGA甲基化和基因相关性分析 上面获得的是基因甲基化和基因表达的相关性分析。我们还可以对甲基化位点和表达情况进行相关分析。但是这种分析只能针对某一个基因,因为如果分析所有基因的甲基化位点,数据量会十分庞大,因此,一般会针对某一个基因的甲基化位点进行分析。首先把之前下载好的甲基化数据拷贝过来,用新的脚本进行处理。保留meta文件,把新的posmerge脚本拷贝到同一个文件夹。 TCGA甲基化和基因相关性分析 在cmd下运行脚本,同时输入对应的基因名称。这里以PDXK为例。脚本会搜索每个样本里这个基因的甲基化位点情况,并生成一个新的矩阵。运行结束后,同样会给出正常样本和肿瘤样本的数目。 TCGA甲基化和基因相关性分析 在新生成的甲基化位点的矩阵文件中个,就包含有PDXK基因的每个位点在每个样本中的甲基化程度。 TCGA甲基化和基因相关性分析 接下来,就可以将基因表达水平和甲基化位点水平进行合并。同样需要之前的基因标准化文件,和上一步获得的位点甲基化文件。然后使用merge脚本进行合并。这个脚本和之前的merge脚本没有什么区别~~~ TCGA甲基化和基因相关性分析 合并完成后,在文件夹中就会生成一个merge文件,这个文件里就包括有位点甲基化信息和基因表达信息。 TCGA甲基化和基因相关性分析 接下来,就可以获得甲基化位点和基因表达相关性,并绘制相关性图了。这个脚本和之前做相关性的脚本其实是一样的,只是在输入名字时输入甲基化位点名字。 TCGA甲基化和基因相关性分析 修改完位点名称之后,直接运行程序,就可以获得甲基化位点和基因表达相关性的图片了。一般cor值大于0.35,p值小于0.05认为是有意义的。 生存分析 PART 4 TCGA甲基化和基因相

文档评论(0)

喜宝 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档