- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学在高通量测序数据分析中的应用
高通量测序技术Life/APG’s Ion torrent PGM 454发明者的新作品 测序反应在微阵列芯片上的微反应池中进行。 每个dNTP结合到延伸链上,会释放出一个H+,pH值变化会导致电位变化。 检测每次dNTP流过的电位差变化,就能知道该dNTP是否连接上去。 高通量测序技术Life/APG’s Ion torrent PGM 优点:速度快( 2 hours),准确度较高(只需要1次聚合反应,电位变化与碱基数量线性关系较好),成本低,芯片可升级 缺点:读长较短(max 200 bp),通量较低(max ~1G) 已有升级版Ion Proton,号称比Ion torrent强100倍。 Ion torrent 318 chip Ion Proton 高通量测序技术Pacific Bioscience’s single molecule sequencing 每个纳米孔底部固定一个已经结合了引物和模板的DNA聚合酶分子。 每次测序反应加入一种荧光标记的dNTP核苷酸,聚合酶在检测空间内将其捕获后产生光曝。 通过连续实时检测每个孔内的荧光信号,就快速测定了每个孔内的模板序列 高通量测序技术Pacific Science’s single molecule sequencing 优点:读长长 (max 15 kb) 缺点:错误率高 (单次反应错误率~15%。经改进后使用多次循环重复,错误率降低到1%),通量低(与读长有关) SMAT Cells Comparison of 5 NGS techniques 454 Solexa SOLiD Ion torrent Pacific 文库制备 乳滴PCR 桥式PCR 乳滴PCR 乳滴PCR 单分子 测序反应 聚合反应 聚合反应 连接反应 聚合反应 聚合反应 原理 焦磷酸 反向终止合成 可剪切探针连接 pH电位差 单分子实时荧光 光学检测 是 是 是 否 是 最大读长 ~1 kb 250 bp 75 bp 200 bp ~ 15 kb 最大数据产出* 700 Mb 600 Gb 300 Gb ~1.2 Gb ~80 Mb 运行时间 较短 长 最长 短 短 主要错误 Indel 替换 替换 Indel CG删除 准确率 低 高 最高 较高 低 平均数据成本 高 低 低 较低 高 数据分析难度 较低 高 最高 高 最低 *最大数据产出量往往不是最大读长的文库 HiSeq 2500和Ion Proton均号称1天测1个30x的人类基因组,成本$1000 高通量测序技术 的主要应用 DNA测序 基因组deno测序 基因组重测序 宏基因组(Metagenome)测序 外显子组测序 RNA测序 转录组测序 表达谱测序 小RNA测序 降解组测序 表观基因组测序 Chip-seq Clip-seq 生物信息学在高通量测序数据中的主要应用 常用生物信息学分析平台与资源 常用编程分析平台:Perl / BioPerlPython / BioPythonR / BioconductorJAVA / BioJava 常用网上资源:NCBI SRA – Sequence Read ArchiveUCSC Genome BrowserSEQanswers – WiKi Forum for NGS 常用基因组拼接软件 Velvet Ray ABySS SOAPdenovo SSAKE SHARCGS MIRA Edena 基因组比对软件 BLAST BLAT MAQ SOAP Bowtie BWA SSAHA ELAND SNP 分析软件 SAMTools SOAPsnp NGS-Backbone MAQ SeqMan NGen CLCBio Genomics 生物信息学在基因组分析方面的应用基因组de novo测序 对未知基因组序列的物种 取样: 动物:血液、肌肉 植物:叶片(黄化叶,组培植株) 估算基因组复杂度(大小、重复序列比例、杂合度) 测序技术: Illunima paired-end为主 Sanger、454、SOLiD为辅, PacBio目前也开始用于基因组测序补洞 文库构建 尽量随机打断 WGS (whole genome shortgun) Coverage depth(覆盖深度or测序深度): 每个碱基被测序的平均次数,是用来衡量测序数据量的首要参数。 测序总数据量/基因组大小 Coverage ratio(覆盖率): 被测序到的碱基占全基因组大小的比率。覆盖比率随覆盖深度升高而提高,亦受测序bias的影响,如illumina测序会受到GC bias的影响,而导致测序不均匀。 理论上(完全随机打断)
您可能关注的文档
- 甘肃省武威2013中考化学试题.docx
- 甘肃省宕昌县南阳中学九年级物理《电功率》课件.ppt
- 甘肃省武威第十一中学七年级语文上册 第26课 小圣施威降大圣教案 (新版)新人教版.doc
- 甘肃省白银市、平凉市、临夏州2013年中考物理试题(word.doc
- 甘肃省玉门市四十里井大理岩矿详查设计.doc
- 生 活 垃 圾 热 解 技 术.doc
- 生 物 周 训 练 十 三.doc
- 生产企业批量事故防范探究.ppt
- 生产和服务提供过程确认的控制程序.doc
- 甘薯超强吸水剂及系列产品开发项目.ppt
- 2024年精细化管理制度(三篇).pdf
- 2024年烟台中考道德与法治经验交流 深耕细研聚合力 稳中求进向前行课件(共31张ppt).pptx
- 第20讲 功 功率 2025年中考物理专题复习(广东)课件(共27张PPT).pptx
- 第17课 西晋的短暂统一和北方各族的内迁 课件(18张PPT).pptx
- 4.5.1 函数的零点与方程的解 课件(共45张ppt)高一数学必修第一册(共人教A版2019).pptx
- 2024版《中国历史》七上第三单元 秦汉时期:统一多民族封建国家的建立和巩固 单元总复习课件【45张PPT】.pptx
- 2024年烟台中考道德与法治经验交流--原点 痛点 热点 支点 课件(共36张ppt).pptx
- 2025届高三一轮复习 工业区位因素及其变化 课件(共34张PPT).pptx
- 第22课《皇帝的新装》课件.pptx
- 2022~2023烟草职业技能鉴定考试题库及答案第683期.pdf
文档评论(0)