网站大量收购闲置独家精品文档,联系QQ:2885784924

生物信息学在高通量测序数据分析中的应用.ppt

生物信息学在高通量测序数据分析中的应用.ppt

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学在高通量测序数据分析中的应用

高通量测序技术 Life/APG’s Ion torrent PGM 454发明者的新作品 测序反应在微阵列芯片上的微反应池中进行。 每个dNTP结合到延伸链上,会释放出一个H+,pH值变化会导致电位变化。 检测每次dNTP流过的电位差变化,就能知道该dNTP是否连接上去。 高通量测序技术 Life/APG’s Ion torrent PGM 优点:速度快( 2 hours),准确度较高(只需要1次聚合反应,电位变化与碱基数量线性关系较好),成本低,芯片可升级 缺点:读长较短(max 200 bp),通量较低(max ~1G) 已有升级版Ion Proton,号称比Ion torrent强100倍。 Ion torrent 318 chip Ion Proton 高通量测序技术 Pacific Bioscience’s single molecule sequencing 每个纳米孔底部固定一个已经结合了引物和模板的DNA聚合酶分子。 每次测序反应加入一种荧光标记的dNTP核苷酸,聚合酶在检测空间内将其捕获后产生光曝。 通过连续实时检测每个孔内的荧光信号,就快速测定了每个孔内的模板序列 高通量测序技术 Pacific Science’s single molecule sequencing 优点:读长长 (max 15 kb) 缺点:错误率高 (单次反应错误率~15%。经改进后使用多次循环重复,错误率降低到1%),通量低(与读长有关) SMAT Cells Comparison of 5 NGS techniques 454 Solexa SOLiD Ion torrent Pacific 文库制备 乳滴PCR 桥式PCR 乳滴PCR 乳滴PCR 单分子 测序反应 聚合反应 聚合反应 连接反应 聚合反应 聚合反应 原理 焦磷酸 反向终止合成 可剪切探针连接 pH电位差 单分子实时荧光 光学检测 是 是 是 否 是 最大读长 ~1 kb 250 bp 75 bp 200 bp ~ 15 kb 最大数据产出* 700 Mb 600 Gb 300 Gb ~1.2 Gb ~80 Mb 运行时间 较短 长 最长 短 短 主要错误 Indel 替换 替换 Indel CG删除 准确率 低 高 最高 较高 低 平均数据成本 高 低 低 较低 高 数据分析难度 较低 高 最高 高 最低 *最大数据产出量往往不是最大读长的文库 HiSeq 2500和Ion Proton均号称1天测1个30x的人类基因组,成本$1000 高通量测序技术 的主要应用 DNA测序 基因组deno测序 基因组重测序 宏基因组(Metagenome)测序 外显子组测序 RNA测序 转录组测序 表达谱测序 小RNA测序 降解组测序 表观基因组测序 Chip-seq Clip-seq 生物信息学在高通量测序 数据中的主要应用 常用生物信息学分析平台与资源 常用编程分析平台: Perl / BioPerl Python / BioPython R / Bioconductor JAVA / BioJava 常用网上资源: NCBI SRA – Sequence Read Archive UCSC Genome Browser SEQanswers – WiKi Forum for NGS 常用基因组拼接软件 Velvet Ray ABySS SOAPdenovo SSAKE SHARCGS MIRA Edena 基因组比对软件 BLAST BLAT MAQ SOAP Bowtie BWA SSAHA ELAND SNP 分析软件 SAMTools SOAPsnp NGS-Backbone MAQ SeqMan NGen CLCBio Genomics 生物信息学在基因组分析方面的应用 基因组de novo测序 对未知基因组序列的物种 取样: 动物:血液、肌肉 植物:叶片(黄化叶,组培植株) 估算基因组复杂度(大小、重复序列比例、杂合度) 测序技术: Illunima paired-end为主 Sanger、454、SOLiD为辅, PacBio目前也开始用于基因组测序补洞 文库构建 尽量随机打断 WGS (whole genome shortgun) Coverage depth(覆盖深度or测序深度): 每个碱基被测序的平均次数,是用来衡量测序数据量的首要参数。 测序总数据量/基因组大小 Coverage ratio(覆盖率): 被测序到的碱基占全基因组大小的比率。覆盖比率随覆盖深度升高而提高,亦受测序bias的影响,如illumina测序会受到GC bias的影响,而导致测序不均匀。 理论上(完全随机打断)

文档评论(0)

ddf55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档