生物信息学是数据导向的科学,大规模测序.pptVIP

  • 1
  • 0
  • 约1.37千字
  • 约 33页
  • 2016-09-01 发布于天津
  • 举报

生物信息学是数据导向的科学,大规模测序.ppt

生物信息学是数据导向的科学,大规模测序.ppt

测序中的数学问题 李松岗 北京大学 2002/04/04 生物信息学是数据导向的科学, 大规模测序 是其最重要的数据来源之一 大规模测序与实验室测序的不同 实验室测序: 手工操作,效率低,结果是第一位的 大规模测序: 流水线操作,自动化 追求稳定、高效、低成本 两种测序策略: 基于BAC的方法: 先把基因组打碎成200-300kb的片段并制成BAC文库,再选择一些BAC进一步打碎成3kb左右的小片段,测序并拼接。 全基因组鸟枪法: 把基因组直接打碎成3kb左右的小片段,测序并拼接。 基于BAC的方法 全基因组DNA 随机打成大片段 选择并克隆 大片段排序,选择 再打碎,克隆,测序,拼接 全基因组鸟枪法 基因组DNA 随机打碎 测序并拼接 近来测序技术的进展 从基于BAC的策略转向全基因组鸟枪法 毛细管自动测序仪的广泛使用 全基因组鸟枪法测序的拼接 困难: 数据量极大 大量重复序列造成拼接途径的不确定 拼接软件的新需求 能充分利用正反向测序的配对信息, 避免重复序列造成的错误拼接 能处理数以百万甚至千万计的数据 程序并行化 高效率比对 能逐步拼接 水稻基因组拼接步骤: 采用数学模型识别重复序列 把重复序列屏蔽掉后,根据是否具有重叠部分进行分组

文档评论(0)

1亿VIP精品文档

相关文档