数据处理流程 - BGI.pptVIP

  • 24
  • 0
  • 约7.38千字
  • 约 36页
  • 2017-03-03 发布于湖北
  • 举报
文库质控问题3:文库随机性 GC含量偏差: 实验技术(打断、PCR、测序)本身特点,导致高GC和低GC区域测序覆盖度偏低,甚至某些区域覆盖不到; PCR-free建库技术可减少PCR带来的随机性问题 duplication PCR扩增出很多一模一样的母版分子,测序结果中很多条reads是一样的; 基因组自身重复序列含量高导致duplication偏高; 数据量越大,duplication比例越高 文库质控问题4:其它物种、样品污染 测序质控问题 raw Cluster密度 正常raw Cluster密度: 20~30万/GAtile,200~350万/HiSeqtile Cluster制备时,控制文库浓度,达到适当的raw Cluster密度 密度过低————产量低;密度过高————质量差 样品差异:200小片段能够容忍的密度较高,800bp片段以及RNA样品、特殊样品,应适当降低密度 通过默认质量筛选标准比例(PF) 用read1前25cycle的信噪比进行筛选; 正常PF比例:DNA 80%,RNA 70%; raw Cluster密度越高,PF比例越低; 当raw Cluster密度超高时,图像分析识别出的raw Cluster数量小于真实值,此时PF比例会低于正常; 测序质控问题 光强度信号 受到环境温度、测序仪温度控制、测序仪聚

文档评论(0)

1亿VIP精品文档

相关文档