微生物分子分型数据研究(pfge、mlst、mlva、wgmlst、宏基因组、全基因组).pdfVIP

  • 20
  • 0
  • 约7.02千字
  • 约 44页
  • 2019-10-14 发布于江苏
  • 举报

微生物分子分型数据研究(pfge、mlst、mlva、wgmlst、宏基因组、全基因组).pdf

BioNumerics用于微生物数据分析的 多种应用 上海一贝科技有限公司 鲁书林 joy@ 管理、分析和探索二代测序数据 测序?下一代测序? • 测序:分析特定DNA片段的碱基序列 • 传统测序:Sanger测序 – 读长较大(约1000bp) – 通量低,读长少(1,2,…,96,…) • 下一代测序:高通量测序 – 读长较短(32-400bp ) – 通量高,读长多(500000,…) 数据生成:概述 • 样本DNA的获得: – 足够的DNA或者正确的目标DNA • 片段化:DNA被碎片化 – 酶切 – 超声或其他物理方法 • 测序:获得ATCG 的碱基排列 • 基本的排除 – 去除化学反应错误的碱基 数据生成:结果 • 输出:读长及质量 • 质量:基本的Phred值 – 表示碱基测序的准确度 – 其中10表示准确度0.9, 20:0.99 ;30:0.999 ;…… 多样本混合测序 • 多样本同时测序时,每个样本需要添加不同的识别序列, 也即标签(MID或barcode)。 • 标签类型取决于测序平台和样本数 NGS数据分析流程 • 基于NGS数据进行分析和比较时,要考虑 – 原始数据的质量评估 – 数据预处理(筛选和剪切) – 组装 • De novo • Mapping – 组装质量评估 – SNP及基因检测 二代测序数据分析 • 微生物全基因组组装及分析 – De novo 组装 – Resequencing 组装 • 微生物分型 – wgMLST • 宏基因组 • 其他应用 全基因组数据分析 数据导入 • Sequence Read Set – 新建SRS实验 – 导入SRS数据 • 可导入Genebank/EMBL格 式文件 • 可直接从公共数据库导入 SRS 数据导入 • 通过导入插件实现 – 自动识别文件格式 – 自动配对单独的双末端数据 • 可完成多样品混合数据分离 – 自动识别样本量 – 根据最小相关度和绝对量进行分离 质量评估:序列基本信息 • SRS实验卡 – 序列数量 – 序列长度统计 – 碱基质量统计 – A 、C、T 、G碱基数 – 非ACTG碱基数及 GC% 质量评估:多种模板报告 • 单个样品分析 – 位置分析 • 碱基分布 • 质量分布 – 序列分析

文档评论(0)

1亿VIP精品文档

相关文档