- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
TCGA甲基化和基因相关性分析
目录
1
TCGA表达数据下载
2
mRNA数据整理
3
相关性分析
4
生存分析
TCGA基因表达数据下载
PART 01
TCGA甲基化和基因相关性分析
下载方式和甲基化数据下载方式类似,在TCGA数据库中选择相应的数据类型,疾病类型,然后加入cart中。
「 」
TCGA甲基化和基因相关性分析
mRNA数据下载,需要下载manifest文件,meta文件以及cart文件。可以直接下载,不需要用TCGA的下载工具。
mRNA数据整理
PART 02
TCGA甲基化和基因相关性分析
将下载的cart压缩文件解压到当前文件夹,并将putFilesToOneDir.pl脚本放到同一个文件夹里,这个脚本能将解压出的所有文件夹里的文件整合到一个文件夹中。
TCGA甲基化和基因相关性分析
通过cmd的方式运行这个脚本。运行结束后,在文件夹中会自动生成一个新的文件夹,名字为files。
TCGA甲基化和基因相关性分析
新生成的文件夹中,就包括了前面解压出的每个文件夹里的压缩包文件。然后将所有的压缩包解压到当前文件夹(建议不要使用360压缩,因为360压缩过程中可能会出错)。
TCGA甲基化和基因相关性分析
将files文件夹剪切回子目录,然后使用mRNA_merge.pl脚本,进行表达文件的数据整合。运行完成后,在文件夹中会生成一个mRNAmatrix的txt文件。同时,会给出所整合的数据中正常样本和肿瘤样本的数目。
TCGA甲基化和基因相关性分析
mRNAmatrix文件就包括样本信息及基因表达信息,但是这时候它的基因ID还是ENSG号。需要进行ID转换,便于后续分析。
TCGA甲基化和基因相关性分析
ID转换需要ID注释文件(huma.gtf),然后在cmd中运行getMrna脚本。运行完成后,在文件夹中会生成一个symbol文件。随后,对这个文件进行标准化处理,即可以获得标准化后的mRNA表达文件。
TCGA甲基化和基因相关性分析
采用edgeR脚本进行分析,这个脚本和之前TARGET数据库的差异分析脚本是同一个,在进行差异分析的同时,进行数据的标准化。运行结束后,在文件夹会生层一个normalizeExp文件,就是标准化后的表达文件。
相关性分析
PART 3
TCGA甲基化和基因相关性分析
首先对标准化后的甲基化数据和基因表达数据进行合并。直接通过R语言merge脚本进行合并。
TCGA甲基化和基因相关性分析
运行脚本,修改路径,运行完成后会重新生成一个merge.txt文件,这个文件就整合了甲基化和表达数据的文件。
TCGA甲基化和基因相关性分析
在merge文件中,会对每个基因的表达数据来源进行标记,在基因后面带有methy的,即来自于甲基化文件,有exp的,即来自于表达文件。
TCGA甲基化和基因相关性分析
获得合并后的文件后,就可以记性甲基化和表达关系相关性分析了。在脚本中设定基因名称和路径,然后直接运行,最终会给出一个相关性图片。
TCGA甲基化和基因相关性分析
上面获得的是基因甲基化和基因表达的相关性分析。我们还可以对甲基化位点和表达情况进行相关分析。但是这种分析只能针对某一个基因,因为如果分析所有基因的甲基化位点,数据量会十分庞大,因此,一般会针对某一个基因的甲基化位点进行分析。首先把之前下载好的甲基化数据拷贝过来,用新的脚本进行处理。保留meta文件,把新的posmerge脚本拷贝到同一个文件夹。
TCGA甲基化和基因相关性分析
在cmd下运行脚本,同时输入对应的基因名称。这里以PDXK为例。脚本会搜索每个样本里这个基因的甲基化位点情况,并生成一个新的矩阵。运行结束后,同样会给出正常样本和肿瘤样本的数目。
TCGA甲基化和基因相关性分析
在新生成的甲基化位点的矩阵文件中个,就包含有PDXK基因的每个位点在每个样本中的甲基化程度。
TCGA甲基化和基因相关性分析
接下来,就可以将基因表达水平和甲基化位点水平进行合并。同样需要之前的基因标准化文件,和上一步获得的位点甲基化文件。然后使用merge脚本进行合并。这个脚本和之前的merge脚本没有什么区别~~~
TCGA甲基化和基因相关性分析
合并完成后,在文件夹中就会生成一个merge文件,这个文件里就包括有位点甲基化信息和基因表达信息。
TCGA甲基化和基因相关性分析
接下来,就可以获得甲基化位点和基因表达相关性,并绘制相关性图了。这个脚本和之前做相关性的脚本其实是一样的,只是在输入名字时输入甲基化位点名字。
TCGA甲基化和基因相关性分析
修改完位点名称之后,直接运行程序,就可以获得甲基化位点和基因表达相关性的图片了。一般cor值大于0.35,p值小于0.05认为是有意义的。
生存分析
PART 4
TCGA甲基化和基因相
您可能关注的文档
- 智慧城市与物联网应用.pptx
- 智慧校园解决方案--突破传统一卡通思路-差异化竞争.pptx
- 智能交通--无人驾驶汽车发展研究.pptx
- 中国农业物联网发展现状与前景分析.pptx
- 中小学智慧校园解决方案.pptx
- 第八章 感知城市.ppt
- 第六章 物联网在社会治安管理中的应用.ppt
- 第七章 智能楼宇.ppt
- liveuc视频会议下载和登陆方法-测试会议室.doc
- 建筑施工行业云视讯解决方案.ppt
- 山东省临沂市沂水县2023-2024学年高一下学期期中考试历史试题.docx
- 江苏省泰州市靖江高级中学2023-2024学年高二下学期4月期中考试物理试题(无答案).docx
- 新疆部分名校2023-2024学年高二下学期期中联合考试语文试题.docx
- 湖南省岳阳市岳阳县第一中学2023-2024学年高三下学期4月期中考试数学试题.docx
- 山东省烟台市2023-2024学年高二下学期4月期中生物试题(无答案).docx
- 江苏省靖江高级中学2023-2024学年高二下学期期中地理试题(无答案).docx
- 四川省甘孜藏族自治州某重点中学2023-2024学年高一下学期4月期中考试物理试题.docx
- 湖北省武汉市华中师范大学第一附属中学2023-2024学年高二下学期4月期中英语试题(无答案).docx
- 四川省成都市金牛区成都市实验外国语学校2024年高三三模考试生物试题.docx
- 浙江省宁波市北仑中学2023-2024学年高二下学期期中考试物理试题.docx
1亿VIP精品文档
相关文档
最近下载
- 泛海三江JB-QGL-9000火灾报警控制器(联动型)使用手册.docx VIP
- 游艇帆船驾照A2F理论培训考试题库大全-下(判断题汇总).docx
- 真空冷冻干燥机及其板层导向杆.pdf VIP
- AP计算机科学A 2021年真题 附答案和评分标准 AP Computer Science A 2021 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 6.1 推理与演绎推理概述(精品课件).pptx
- 乡村振兴战略下农产品区域品牌协同共建研究基于价值共创的视角.docx VIP
- 洪水风险区划及防治区划编制技术要求(试行).pdf
- 2023-2024学年上海市大同中学高三上学期开学考试英语试卷含详解.docx VIP
- 幼儿陶艺课课件.pptx VIP
- 2023年研究生考试英语(一)真题及详版答案解析.pdf
文档评论(0)