- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
哈尔滨医科大学第四期生物信息培训班
基于新一代测序技术的整合组学分析-实验文档
目标:分析RNA-seq 与MeDIP-seq 获取疾病相关的差异表达lncRNA 与异常DNA
甲基化区域,并识别受DNA 甲基化影响的lncRNA 。
使用软件:Tophat-2.0.8,Cufflinks,Bowtie-,Samtools-,
Bedtools-2.6,R-3.0.0,MEDIPS-1.6.0,UCSC
使用平台:Linux
具体步骤如下:
准备阶段
1. 需要打开shell 软件
登入50 用户名:liyq 密码:bio_hrbmu
进入到特定的目录:cd /pub1/liyq/test/user
建立一个你自己的目录:mkdir xiaoyun
进入所建立的目录:cd xiaoyun
获得你建立目录的路径:pwd
一、识别疾病中差异表达lncRNA
1. 获取疾病与正常的RNA-seq 数据
疾病:/pub1/liyq/test/fasta/sc-RNA-seq-chr22.fa
正常:/pub1/liyq/test/fasta/nor-RNA-seq-chr22.fa
注意:这里的RNA-seq 数据都是来自22 号染色体
注意:由于多人同时比对与装配(尤其是tophat 比对),需要消耗大量的服务器
资源,建议学员只处理一个样本即可,或者直接拷贝已经比对与装配好的文件至
所建立的目录中
cp -R /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.tophat ./
cp -R /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.cufflinks/ ./
cp -R /pub1/liyq/test/user/xiaoyun/nor-RNA-seq.tophat/ ./
cp -R /pub1/liyq/test/user/xiaoyun/nor-RNA-seq.cufflinks/ ./
2. 比对RNA-seq 数据
步骤简介:对RNA-seq 数据中的所有read 与参考基因组进行比对,并考虑剪切比对方式
步骤代码:
疾病:
/pub1/liyq/test/sf/tophat -o /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.tophat
--bowtie1 --library-type fr-unstranded /pub1/liyq/test/sf/index/hg19
/pub1/liyq/test/fasta/sc-RNA-seq-chr22.fa
参数说明:
/pub1/liyq/test/sf/tophat 表示mapping 软件tophat
-o 表示结果的输出路径,即得到的结果存放在
/pub1/liyq/test/user/xiaoyun/sc-RNA-seq.tophat 这一目录下面(可以建立自己的结果文件
夹,但是注意要把你所建立的文件夹的权限设定为可写);
--bowtie1 表示使用的bowtie 的版本,这里使用bowtie1;
--library-type fr-unstranded 表示测序时,文库制备的类型;
/pub1/liyq/test/sf/index/hg19 表示mapping 过程中参考基因组的bowtie index,注意:这里
使用的是hg19 版本的bowtie index;
/pub1/liyq/test/fasta/sc-RNA-seq-chr22.fa 表示需要进行mapping 的疾病RNA-seq 文件地址
由于该计算时间大约为10 分钟,并且多人同时计算,这里也为大家提供qsub 提交的脚本文
件(这种方式能够将处理需求移交到服务器其他的计算节点),需要注意的是,你需要修改该
文件的部分内容,以便输出目录正确
/pub1/liyq/test/qsub/sc_RNA_seq_tophat.pbs
#然后输入qsub sc_RNA_seq_tophat.pbs,就可以对疾病样本的RNA-seq 数据进行reads 的
mapping
注意:当你的结果输出文件夹中出现prep_ 等 ,则说明你的程序已经成功的运行,
(这一过程比较久,大概需要10min)如下图所示:
注意:下图是最后得出的结果,tophat 这里给出以下几个结果,我们选择accepted_hits.bam 进
行转录本的装配
上述步骤仅是处理了疾病样本,你还需要对正常样本做同样的处理
nor-RNA
文档评论(0)