哈尔滨医科大学第四期生物信息培训班-整合分析实验文档.pdf

哈尔滨医科大学第四期生物信息培训班-整合分析实验文档.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
哈尔滨医科大学第四期生物信息培训班 基于新一代测序技术的整合组学分析-实验文档 目标:分析RNA-seq 与MeDIP-seq 获取疾病相关的差异表达lncRNA 与异常DNA 甲基化区域,并识别受DNA 甲基化影响的lncRNA 。 使用软件:Tophat-2.0.8,Cufflinks,Bowtie-,Samtools-, Bedtools-2.6,R-3.0.0,MEDIPS-1.6.0,UCSC 使用平台:Linux 具体步骤如下: 准备阶段 1. 需要打开shell 软件 登入50 用户名:liyq 密码:bio_hrbmu 进入到特定的目录:cd /pub1/liyq/test/user 建立一个你自己的目录:mkdir xiaoyun 进入所建立的目录:cd xiaoyun 获得你建立目录的路径:pwd 一、识别疾病中差异表达lncRNA 1. 获取疾病与正常的RNA-seq 数据 疾病:/pub1/liyq/test/fasta/sc-RNA-seq-chr22.fa 正常:/pub1/liyq/test/fasta/nor-RNA-seq-chr22.fa 注意:这里的RNA-seq 数据都是来自22 号染色体 注意:由于多人同时比对与装配(尤其是tophat 比对),需要消耗大量的服务器 资源,建议学员只处理一个样本即可,或者直接拷贝已经比对与装配好的文件至 所建立的目录中 cp -R /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.tophat ./ cp -R /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.cufflinks/ ./ cp -R /pub1/liyq/test/user/xiaoyun/nor-RNA-seq.tophat/ ./ cp -R /pub1/liyq/test/user/xiaoyun/nor-RNA-seq.cufflinks/ ./ 2. 比对RNA-seq 数据 步骤简介:对RNA-seq 数据中的所有read 与参考基因组进行比对,并考虑剪切比对方式 步骤代码: 疾病: /pub1/liyq/test/sf/tophat -o /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.tophat --bowtie1 --library-type fr-unstranded /pub1/liyq/test/sf/index/hg19 /pub1/liyq/test/fasta/sc-RNA-seq-chr22.fa 参数说明: /pub1/liyq/test/sf/tophat 表示mapping 软件tophat -o 表示结果的输出路径,即得到的结果存放在 /pub1/liyq/test/user/xiaoyun/sc-RNA-seq.tophat 这一目录下面(可以建立自己的结果文件 夹,但是注意要把你所建立的文件夹的权限设定为可写); --bowtie1 表示使用的bowtie 的版本,这里使用bowtie1; --library-type fr-unstranded 表示测序时,文库制备的类型; /pub1/liyq/test/sf/index/hg19 表示mapping 过程中参考基因组的bowtie index,注意:这里 使用的是hg19 版本的bowtie index; /pub1/liyq/test/fasta/sc-RNA-seq-chr22.fa 表示需要进行mapping 的疾病RNA-seq 文件地址 由于该计算时间大约为10 分钟,并且多人同时计算,这里也为大家提供qsub 提交的脚本文 件(这种方式能够将处理需求移交到服务器其他的计算节点),需要注意的是,你需要修改该 文件的部分内容,以便输出目录正确 /pub1/liyq/test/qsub/sc_RNA_seq_tophat.pbs #然后输入qsub sc_RNA_seq_tophat.pbs,就可以对疾病样本的RNA-seq 数据进行reads 的 mapping 注意:当你的结果输出文件夹中出现prep_ 等 ,则说明你的程序已经成功的运行, (这一过程比较久,大概需要10min)如下图所示: 注意:下图是最后得出的结果,tophat 这里给出以下几个结果,我们选择accepted_hits.bam 进 行转录本的装配 上述步骤仅是处理了疾病样本,你还需要对正常样本做同样的处理 nor-RNA

文档评论(0)

zzqky + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档