RSEM和bowtie2的简介.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
RSEM和bowtie2的简介创新

RSEM原理简介 2016-9-2 Outline Why do we use RSEM ? 转录组表达定量面临的挑战: reads数量随基因长度不同而不同 RNA-SEQ 测序深度不同测序获得的reads总数也同 由于可变剪切和基因重复等原因,部分reads可能mapping到多个转录本或者多个基因上,造成定量困难。 Why do we use RSEM ? 转录组表达定量的方法: 通常采用归一化处理来消除前两项两种系统差异。 RPKM( Reads Per KilobasesPer Million reads)指的是每 1 百万个reads中比对到每1 kb碱基外显子上的 reads数。 当reads来自于PE测序数据时,类似的归一化方法有FPKM ( Fragments Per Kilobase Per million reads)。 Why do we use RSEM ? 转录组表达定量的方法: 一般有两种方法减小可变剪切造成的影响: 1) 采用只比对到一个参考位置的reads数量计算表达量。典型的算法有Alexa-seq。 2) 采用似然函数估计法处理reads不确定性的问题。典型的算法有Cufflinks、MISO 和 RSEM (Bo Li Colin N Dewey. 2011) How does RSEM work ? How does RSEM work ? RSME: RNASeq by Expectation Maximization How does RSEM work ? RSEM数学模型由n个随机变量控制。 Gn、Fn、Sn、On分别代表基因来源、长度、起始位置和方向。 对于PE data,变量为L1 n、L2 n和Q1 n、Q2 n和R1 n、R2 n,分别代表read长度、质量分数和序列。 对于SE数据,L2 n,Q2 n和R2 n是不考虑的。 这个模型的主要参数是由θ给出,它代表一个片段来自每个转录本的先验概率。 How does RSEM work ? 先验概率: 事情还没有发生,要求这件事情发生的可能性的大小。 最大似然法: 当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。 调用bowtie寻找每个read的所有比对情况, 只允许在开始的25个碱基中有两个错配。 RSEM使用EM算法找到抽取样本中θ的最大可能性 (Maximum likelihood)。 根据θ的Maximum likelihood计算所有reads的表达量情况, 得出FPKM值 How does RSEM work ? 调用bowtie寻找每个read的所有比对情况, 只允许在开始的25个碱基中有两个错配。 RSEM使用EM算法找到抽取样本中θ的最大可能性 (Maximum likelihood)。 根据θ的Maximum likelihood计算所有reads的表达量情况, 得出FPKM值 How to run RSEM? RSEM_prepare.sh RSEM_GCI.sh How to run RSEM? Sample.isoforms.results Sample.genes.results How to run RSEM? Bowtie2用法简介 海外信息部-王志 2016-9-2 Bowtie2用法介绍 Bowtie2适合于将短序列拼接到大的模板序列上。 Bowtie2设计思路如下: 1)短序列在基因组上至少有一处最适匹配; 2)大部分的短序列的质量是比较高; 3)短序列在基因组上最适匹配的位置最好只有一处。 Bowtie2用法介绍 bowtie2-build.sh 将会生成以out1_put_dir开始名字,后缀为`.1.bt2`, `.2.bt2`, `.3.bt2`, `.4.bt2`,`.rev.1.bt2`, and `.rev.2.bt2`.?的六个文件; bowtie2-build?可以处理来自[UCSC], [NCBI],[Ensembl]的fasta文件,当处理多个fasta文件的时候,可以用逗号分开处理. Bowtie用法介绍 Bowtie2.sh 输出格式默认为SAM,如果是SE用-U替换-1,-2 Sam2bam.sh 将sam文件转换成bam文件。

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档