网站大量收购独家精品文档,联系QQ:2885784924

8-第4章-2 全基因组测序.pdf

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章-2 全基因组测序 全基因组 将基因组DNA随机断裂后克隆,随后 根据载体插入位点序列设计通用引物 鸟枪法测序 自动化两端测序。两端序列为读序, 可输入计算机拼接为重叠群(Contig). DNA 序列 组装 后 质量 判断 基因组DNA随机克隆后,采取克隆DNA两端测序。获得的测序称为读序 (reads),可以根据序列的重叠依次排序组成重叠群 (Contig)。这些 Contig的质量判断引入了一个统计学的估算,即Contig N50。大于 Contig N50的重叠群可被入选,进入下一步的组装。 由下至 上的 鸟枪法 测序 - 分别构建 2,10,40, 150 kb DNA文库 这是一种由下而上的测序组装策略。2 kb小片段的两端顺序测序后, 可搭建一系列的重叠群。由2 kb两端顺序组建的重叠群可以通过 10 kb片段两端顺序归并,10 kb两端顺序组建的重叠群可以通过40 kb两端顺序归并,依此类推,逐级而上。最后以BAC克隆收尾, 再根据分子标记锚定到染色体连锁图上。 基因组测序覆盖面 在进行一个具体的基因组测序之前,首先需要考虑测序的 规模,即需要获得多少测序数据才能覆盖整个基因组。 这里有一个可供测算的公式用以计算测序的覆盖面,其 中P定义为丢失概率:  P0 = em ,m为覆盖面,即单倍体基因组数;e为自然对 数底数。  若m = 1 P0 = e1 = 0.37 = 37% (遗漏37% )  若m = 5 P0 = e5 = 0.0067 = 0.67% (遗漏0.67% )  若m = 10 P = e10 = 4.5 ×105 = 0 0.000 045 = 0.004 5% (遗漏0.0045% ) 理论上遗漏的比例越少越好,但实际基因组测序必须考 虑成本。通常兼顾准确率和耗费,一般覆盖面在x10 。 随机事件发生概率的估算 假定在一个封闭的箱子 里有10个已按序列1 至10编号的小球,每 次从中取出一个小球 记下其编号,反复10 次。按上述公式计算 ,总共有37%即4个 小球从未拿到。如果 将随机挑取小球的次 数增加到50次,此时 从未拿到的小球约占 0.67%,即所有的小 球都有可能被拿到。 大型基因组图位法测序 - 以BAC克隆重叠群 为基础测序 克 隆 重 叠 群 测 序 与 组 装 测序深度(Deepth in DNA sequencing 测序深度与 )系指测序的DNA核苷酸序列的总 深度测序 长与被测序DNA序列之间的倍数, 即覆盖面积或者平均每个核苷酸被 测序次数。通常基因组测序的总长 要大大超过基因组实际的碱基数目 ,即单个核苷酸被重复多次测序。 一般深度测序指测序覆盖倍数大于7x

文档评论(0)

恬淡虚无 + 关注
实名认证
内容提供者

学高为师,身正为范.师者,传道授业解惑也。做一个有理想,有道德,有思想,有文化,有信念的人。 学无止境:活到老,学到老!有缘学习更多关注桃报:奉献教育,点店铺。

1亿VIP精品文档

相关文档