- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一步一步教你做转录组分析(HISAT, StringTie and
Ballgown)
该分析流程主要根据 2016 年发表在 Nature Protocols
上的一篇名为 Transcript-level expression analysis of RNA-
seq experiments with HISAT, StringTie and Ballgown 的文章
撰写的,主要用到以下三个软件:HISAT
(/software/hisat/index.shtml)利用大量 FM
索引,以覆盖整个基因组,能够将 RNA-Seq 的读取与基因
组进行快速比对,相较于 STAR 、Tophat ,该软件比对速度
快,占用内存少。
StringTie(/software/stringtie/)能够应用流
神经网络算法和可选的 de novo 组装进行转录本组装并预
计表达水平。与 Cufflinks 等程序相比,StringTie 实现了更
完整、更准确的基因重建,并更好地预测了表达水平。
Ballgown (/alyssafrazee/ballgown)是 R 语
言中基因差异表达分析的工具,能利用 RNA-Seq 实验的数
据(StringTie, RSEM, Cufflinks)的结果预测基因、转录本的差
异表达。然而 Ballgown 并没有不能很好地检测差异外显子,
而 DEXseq、rMATS 和 MISO 可以很好解决该问题。
一、数据下载 Linux 系统下常用的下载工具是 wget ,但
工具是单线程下载,当使用它下载较大数据时比较慢,所
以选择 axel,终端中输入安装命令:$sudo yum install axel
然后提示输入密码获得 root 权限后即可自动安装,安装完
成后,输入命令 axel,终端会显示如下内容,表示安装成功。
Axel 工具常用参数有:axel [选项][下载目录][下载地
址]-s :指定每秒下载最大比特数-n :指定同时打开的线
程数-o :指定本地输出文件-S :搜索镜像并从X servers 服
务器下载-N :不使用代理服务器-v :打印更多状态信息-
a :打印进度信息-h :该版本命令帮助-V :查看版本信息号
#Axel 安装成功后在终端中输入命令:$axel
/pub/RNAseq_protocol/chrX_data.tar.gz
此时在终端中会显示如下图信息,如果不想该信息刷屏,
添加参数 q,采用静默模式即可。
#数据下载后,进行解压:$tar–zxvfchrX_data.tar.gz 解压后
利用 tree 命令查看数据结构,它会以树状图的形式列出目
录的内容。整个数据的结构如下图所示:
chrX_gtf 是 X 号染色体的注释文件 chrX.fa 是 X 号染色体的
序列文件 indexes 文件夹中是 HISAT 对于 X 号染色体的
index 文件,该文件是根据序列文件 chrX.fa 利用 hisat2-
build 构建的,samples 文件夹中的 12 个 fastq 文件是英格
兰岛和约鲁巴住民的 X 号染色体的数据。
二、软件安装首先安装 bioconda,它是一个自动化管理生
物信息软件的工具,安装简单,且各个软件依赖的环境一
同打包且相互隔离,非常适合在服务器中搭建生信分析环
境。#下载和安装 miniconda$ wget
https://repo.continuum.io/miniconda/Miniconda3-latest-
Linux-x86_64.sh#下载完成后在终端中安装$bash
Miniconda-latest-Linux-x86_64.sh 按照提示安装,完成后
$source ~/.bashrc #使以上的安装立即生效#输入以下命令
检验 miniconda 是否安装成功$ conda list 显示如下图信息
说明安装成功
然后利用 conda install 软件名+版本号安装软件即可,我们
需要安装 hisat2、stringtie 、samtools 三个软件,安装的命
令为:$ condainstall hisat2$ condainstall stringtie$
condainstall samtools
三、分析流程 1、使用 HISAT 将读段匹配到参考基因组上,
使用者可以提供注释文件,但 HISAT 依旧会检测注释文件
没有列出来
文档评论(0)