- 20
- 0
- 约7.02千字
- 约 44页
- 2019-10-14 发布于江苏
- 举报
BioNumerics用于微生物数据分析的
多种应用
上海一贝科技有限公司
鲁书林
joy@
管理、分析和探索二代测序数据
测序?下一代测序?
• 测序:分析特定DNA片段的碱基序列
• 传统测序:Sanger测序
– 读长较大(约1000bp)
– 通量低,读长少(1,2,…,96,…)
• 下一代测序:高通量测序
– 读长较短(32-400bp )
– 通量高,读长多(500000,…)
数据生成:概述
• 样本DNA的获得:
– 足够的DNA或者正确的目标DNA
• 片段化:DNA被碎片化
– 酶切
– 超声或其他物理方法
• 测序:获得ATCG 的碱基排列
• 基本的排除
– 去除化学反应错误的碱基
数据生成:结果
• 输出:读长及质量
• 质量:基本的Phred值
– 表示碱基测序的准确度
– 其中10表示准确度0.9, 20:0.99 ;30:0.999 ;……
多样本混合测序
• 多样本同时测序时,每个样本需要添加不同的识别序列,
也即标签(MID或barcode)。
• 标签类型取决于测序平台和样本数
NGS数据分析流程
• 基于NGS数据进行分析和比较时,要考虑
– 原始数据的质量评估
– 数据预处理(筛选和剪切)
– 组装
• De novo
• Mapping
– 组装质量评估
– SNP及基因检测
二代测序数据分析
• 微生物全基因组组装及分析
– De novo 组装
– Resequencing 组装
• 微生物分型
– wgMLST
• 宏基因组
• 其他应用
全基因组数据分析
数据导入
• Sequence Read Set
– 新建SRS实验
– 导入SRS数据
• 可导入Genebank/EMBL格
式文件
• 可直接从公共数据库导入
SRS 数据导入
• 通过导入插件实现
– 自动识别文件格式
– 自动配对单独的双末端数据
• 可完成多样品混合数据分离
– 自动识别样本量
– 根据最小相关度和绝对量进行分离
质量评估:序列基本信息
• SRS实验卡
– 序列数量
– 序列长度统计
– 碱基质量统计
– A 、C、T 、G碱基数
– 非ACTG碱基数及
GC%
质量评估:多种模板报告
• 单个样品分析
– 位置分析
• 碱基分布
• 质量分布
– 序列分析
您可能关注的文档
- 探究水温对金鱼呼吸的影响28013.ppt
- 探水钻使用指导书.doc
- 探索性数据研究(00002).pdf
- 探索性因素研究.ppt
- 探索生命的方法27761.ppt
- 探讨天体磁场.doc
- 炭黑气力输送系统.ppt
- 探索性数据研究(00001).doc
- 糖尿病和骨质疏松.pdf
- 糖尿病社区指导规范化管理.ppt
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
原创力文档

文档评论(0)