- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
RSEM和bowtie2的简介创新
RSEM原理简介 2016-9-2 Outline Why do we use RSEM ? 转录组表达定量面临的挑战: reads数量随基因长度不同而不同 RNA-SEQ 测序深度不同测序获得的reads总数也同 由于可变剪切和基因重复等原因,部分reads可能mapping到多个转录本或者多个基因上,造成定量困难。 Why do we use RSEM ? 转录组表达定量的方法: 通常采用归一化处理来消除前两项两种系统差异。 RPKM( Reads Per KilobasesPer Million reads)指的是每 1 百万个reads中比对到每1 kb碱基外显子上的 reads数。 当reads来自于PE测序数据时,类似的归一化方法有FPKM ( Fragments Per Kilobase Per million reads)。 Why do we use RSEM ? 转录组表达定量的方法: 一般有两种方法减小可变剪切造成的影响: 1) 采用只比对到一个参考位置的reads数量计算表达量。典型的算法有Alexa-seq。 2) 采用似然函数估计法处理reads不确定性的问题。典型的算法有Cufflinks、MISO 和 RSEM (Bo Li Colin N Dewey. 2011) How does RSEM work ? How does RSEM work ? RSME: RNASeq by Expectation Maximization How does RSEM work ? RSEM数学模型由n个随机变量控制。 Gn、Fn、Sn、On分别代表基因来源、长度、起始位置和方向。 对于PE data,变量为L1 n、L2 n和Q1 n、Q2 n和R1 n、R2 n,分别代表read长度、质量分数和序列。 对于SE数据,L2 n,Q2 n和R2 n是不考虑的。 这个模型的主要参数是由θ给出,它代表一个片段来自每个转录本的先验概率。 How does RSEM work ? 先验概率: 事情还没有发生,要求这件事情发生的可能性的大小。 最大似然法: 当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。 调用bowtie寻找每个read的所有比对情况, 只允许在开始的25个碱基中有两个错配。 RSEM使用EM算法找到抽取样本中θ的最大可能性 (Maximum likelihood)。 根据θ的Maximum likelihood计算所有reads的表达量情况, 得出FPKM值 How does RSEM work ? 调用bowtie寻找每个read的所有比对情况, 只允许在开始的25个碱基中有两个错配。 RSEM使用EM算法找到抽取样本中θ的最大可能性 (Maximum likelihood)。 根据θ的Maximum likelihood计算所有reads的表达量情况, 得出FPKM值 How to run RSEM? RSEM_prepare.sh RSEM_GCI.sh How to run RSEM? Sample.isoforms.results Sample.genes.results How to run RSEM? Bowtie2用法简介 海外信息部-王志 2016-9-2 Bowtie2用法介绍 Bowtie2适合于将短序列拼接到大的模板序列上。 Bowtie2设计思路如下: 1)短序列在基因组上至少有一处最适匹配; 2)大部分的短序列的质量是比较高; 3)短序列在基因组上最适匹配的位置最好只有一处。 Bowtie2用法介绍 bowtie2-build.sh 将会生成以out1_put_dir开始名字,后缀为`.1.bt2`, `.2.bt2`, `.3.bt2`, `.4.bt2`,`.rev.1.bt2`, and `.rev.2.bt2`.?的六个文件; bowtie2-build?可以处理来自[UCSC], [NCBI],[Ensembl]的fasta文件,当处理多个fasta文件的时候,可以用逗号分开处理. Bowtie用法介绍 Bowtie2.sh 输出格式默认为SAM,如果是SE用-U替换-1,-2 Sam2bam.sh 将sam文件转换成bam文件。
您可能关注的文档
- 《老人与海》修改课件ppt..ppt
- 4.1-多民族的大家庭湘教版八年级下册.ppt
- 《编写童话故事》PPT课件.ppt
- 钣金加工注意事项.docx
- 《精细的描写》参考课件1.ppt
- 4.15篇范文陪你欣然步入考场.ppt
- 《老人与海》课件-讲课使用.ppt
- 《老王》优秀课件ppt -.ppt
- 《绿色植物与生物圈的水循环》教学课件(第1课时).ppt
- 4.19《报任安书(节选)》课件(粤教版必修5).ppt
- 2025年四川省聚焦中考物理 必备考点透析 第4部分 力学第1讲 机械运动(实验法、测量等).pptx
- 2025年四川省聚焦中考物理 必备考点透析-第5部分 电磁学 第1讲 电流和电路.pptx
- 2025年四川省聚焦中考物理 必备考点透析-第4部分 力学第7讲 功和机械能.pptx
- 2025年四川省聚焦中考物理 必备考点透析-第5部分 电磁学第2讲 电压 电阻.pptx
- 2025年四川省聚焦中考物理 必备考点透析-第5部分 电磁学第8讲 信息的传递 能源与可持续发展.pptx
- 2025年四川省聚焦中考物理 必备考点透析-第4部分 力学第8讲 简单机械.pptx
- 人力资源数字化转型推进计划.docx
- 数字货币支付系统安全标准制定.docx
- 物流信息共享平台建设与运营.docx
- 服装业精准需求计划管理实践.docx
文档评论(0)