一步一步教你做转录组分析(HISAT--StringTie-and-Ballgown)最新.pdfVIP

一步一步教你做转录组分析(HISAT--StringTie-and-Ballgown)最新.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一步一步教你做转录组分析(HISAT, StringTie and Ballgown) 该分析流程主要根据 2016 年发表在 Nature Protocols 上的一篇名为 Transcript-level expression analysis of RNA- seq experiments with HISAT, StringTie and Ballgown 的文章 撰写的,主要用到以下三个软件:HISAT (/software/hisat/index.shtml)利用大量 FM 索引,以覆盖整个基因组,能够将 RNA-Seq 的读取与基因 组进行快速比对,相较于 STAR 、Tophat ,该软件比对速度 快,占用内存少。 StringTie(/software/stringtie/)能够应用流 神经网络算法和可选的 de novo 组装进行转录本组装并预 计表达水平。与 Cufflinks 等程序相比,StringTie 实现了更 完整、更准确的基因重建,并更好地预测了表达水平。 Ballgown (/alyssafrazee/ballgown)是 R 语 言中基因差异表达分析的工具,能利用 RNA-Seq 实验的数 据(StringTie, RSEM, Cufflinks)的结果预测基因、转录本的差 异表达。然而 Ballgown 并没有不能很好地检测差异外显子, 而 DEXseq、rMATS 和 MISO 可以很好解决该问题。 一、数据下载 Linux 系统下常用的下载工具是 wget ,但 工具是单线程下载,当使用它下载较大数据时比较慢,所 以选择 axel,终端中输入安装命令:$sudo yum install axel 然后提示输入密码获得 root 权限后即可自动安装,安装完 成后,输入命令 axel,终端会显示如下内容,表示安装成功。 Axel 工具常用参数有:axel [选项][下载目录][下载地 址]-s :指定每秒下载最大比特数-n :指定同时打开的线 程数-o :指定本地输出文件-S :搜索镜像并从X servers 服 务器下载-N :不使用代理服务器-v :打印更多状态信息- a :打印进度信息-h :该版本命令帮助-V :查看版本信息号 #Axel 安装成功后在终端中输入命令:$axel /pub/RNAseq_protocol/chrX_data.tar.gz 此时在终端中会显示如下图信息,如果不想该信息刷屏, 添加参数 q,采用静默模式即可。 #数据下载后,进行解压:$tar–zxvfchrX_data.tar.gz 解压后 利用 tree 命令查看数据结构,它会以树状图的形式列出目 录的内容。整个数据的结构如下图所示: chrX_gtf 是 X 号染色体的注释文件 chrX.fa 是 X 号染色体的 序列文件 indexes 文件夹中是 HISAT 对于 X 号染色体的 index 文件,该文件是根据序列文件 chrX.fa 利用 hisat2- build 构建的,samples 文件夹中的 12 个 fastq 文件是英格 兰岛和约鲁巴住民的 X 号染色体的数据。 二、软件安装首先安装 bioconda,它是一个自动化管理生 物信息软件的工具,安装简单,且各个软件依赖的环境一 同打包且相互隔离,非常适合在服务器中搭建生信分析环 境。#下载和安装 miniconda$ wget https://repo.continuum.io/miniconda/Miniconda3-latest- Linux-x86_64.sh#下载完成后在终端中安装$bash Miniconda-latest-Linux-x86_64.sh 按照提示安装,完成后 $source ~/.bashrc #使以上的安装立即生效#输入以下命令 检验 miniconda 是否安装成功$ conda list 显示如下图信息 说明安装成功 然后利用 conda install 软件名+版本号安装软件即可,我们 需要安装 hisat2、stringtie 、samtools 三个软件,安装的命 令为:$ condainstall hisat2$ condainstall stringtie$ condainstall samtools 三、分析流程 1、使用 HISAT 将读段匹配到参考基因组上, 使用者可以提供注释文件,但 HISAT 依旧会检测注释文件 没有列出来

文档评论(0)

130***1990 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档