软件工具转录组比对使用说明.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

#软件工具#关于转录组比对STAR软件使用说明

玉才

1:软件参考文献:2012-STAR:ultrafastuniversalRNA-seqaligner

2:是因为有了tophat才暗淡了这个比对软件,但是后来者居上。个人觉

得STAR比对软件要好于tophat,而且后者的分析结果兼容前者。这个

可是ENCODE御用的。好处不多说,看一下具体用法。

3:STAR的比对分析基本上可以分为两步:一是genomeGenerate(类似于

tophat的index);二是:序列比对

4:关于第一步genomeGenerate运行一次就可以了:

STAR--runModegenomeGenerate--runThreadN10--genomeFastaFiles

/home/share/genome/Homo_sapiens/UCSC/hg19/Sequence/WholeGenome

Fasta/genome.fa--sjdbGTFfile

/home/share/genome/Homo_sapiens/UCSC/hg19/Annotation/Genes/genes.

gtf--sjdbOverhang89

—runMode:运行程序模式,默认是比对,所以第一步这个参数设置很

关键

—runThreadN:运行的线程数

—genomeDir:这个参数很重要,是存放你声称index文件路径,需要

你事先建立一个有可读写权限的文件夹

—genomeFastaFiles组fasta格式文件

—sjdbGTFfileGTF注释文件

—sjdbOverhang这个值为你read的长度减1,是在注释可变剪切序

列的时候使用的最大长度值

5:运行比对

STAR不但可以进行比对,还可以输出可变剪切,转录本融合,

以及控制输出格式为SAM或者BAM,并对输出的BAM可进行选择性排

序输出。最主要在比对的过程中还提供了ENCODE的比对参数。

STAR--runThreadN20--readFilesIn

/home/fanyc/RNA-seq/raw_data/SRR993723.sra_1.fastq

/home/fanyc/RNA-seq/raw_data/SRR993723.sra_2.fastq--quantMode

TranscriptomeSAM--outSAMtypeBAMSortedByCoordinate

--outFileNamePrefix/home/fanyc/RNA-seq/STAR/23--outFilterType

BySJout--outFilterMultimapNmax20--alignSJoverhangMin8

--alignSJDBoverhangMin1--outFilterMismatchNmax999

--outFilterMismatchNoverLmax0.04--alignIntronMin20

--alignIntronMax1000000--alignMatesGapMax1000000

--chimSegmentMin20

上面结合了ENCODE的参数,同时又加上了比对输出为BAM格式,并

对BAM格式进行排序。另外输出可变剪切,以及转录本融合的结果。

—readFilesIn输出的原始数据

--outSAMtypeBAMSortedByCoordinate输出格式为BAM并排序

--chimSegmentMin20输出融合转录本,20代表比对的最短的碱基数目

--outFileNamePrefix输出文件的前缀

--quantModeTranscriptomeSAM转录本定量

6:生成的文件:

Chimeric.out.junction融合转录本

Aligned.sortedByCoord.out.bam比对输出

Aligned.toTranscriptome.out.bam转录本比对输出

SJ.out.tab可变剪切结果输出

注:对于

文档评论(0)

daluobu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档