基因组学和蛋白质组学工具精品课件.ppt

基因组学和蛋白质组学工具精品课件.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因组学和蛋白质组学工具 主要内容 一、序列组装 二、功能基因组学 三、蛋白质组学 一、序列组装 研究内容: 1、怎样将散的序列拼接起来 2、如何去掉序列中重复的部分 1、怎样将散的序列拼接起来 我们知道,使用鸟枪法的DNA测序提供了成千上百万个小序列,每一个片段长度有400~500个碱基对。 当基因组被提取成限制性片段时,它只是被部分提取。用于DNA样品的限制性酶数量只能够切开50%的酶切位点。这就意味着有些片段会跨过某个特殊的限制性位点,而另一些片段会在那个特定位点切开,而跨过其他的限制性位点。因此,这些限制性片段组成的克隆库会包含重叠片段。这些重叠片段正是序列拼接的基础。 1、怎样将散的序列拼接起来 在得到了每个片段的序列后,序列拼接(sequence assembly)的任务就利用这些片段间的重叠,将它们拼接成原来的序列。拼接的关键问题是得到每个片段在一个长序列中的位置信息,这种组合的集合称为contig(contiguous segment)。 序列拼接问题可以抽象为最短超序列问题(Shortest Superstring Problem,SSP)。假设一个序列片段集合A={a1,a2,?,an},我们希望发现一个最短的序列S,A中所有的片段都是S的子序列。例如有序列集合:{000,001,010,011,100,101,110,101,111},包括集合中所有序列的最短超序列是:0001110100。 1、怎样将散的序列拼接起来 直接鸟枪法序列拼接: 从已测序的小片段中寻找彼此重叠的测序克隆,依次向两侧邻接的序列延伸,组装成一个完整的基因组。不需预先了解任何基因组的情况,即使缺少遗传图或物理图也可完成整个基因组顺序组装。 优点:最大优点是经济、快速、高效。 缺点:“鸟枪法”对高性能计算的方法和设备要求非常高,且无法测到人类基因组中重复出现的DNA片段,这些片段占到基因组的3%至5%,对于理解遗传性疾病具有重要意义。 1、怎样将散的序列拼接起来 Phrap算法序列拼接: 1、找出序列片段间的重叠信息。 2、将存在有重叠的片段组合起来,形成一个contig结构。 3、形成Consensus序列(Consensus)。 优点:精确度较高。 缺点:运算时间较长且对存储空间的需求较大。 2、如何去掉序列中重复的部分 重复片段是指在目标片段中多次出现的片段。对于小规模的拼接工作例如细菌的基因组(重复序列约占全序列的1.5%)和果蝇基因组(约占全序列的3%)等,问题不明显,然而,人类基因组中含有50%以上的重复序列,这就对基因组测序产生了很大的困难。 目前已经出现的很多用于shotgun片段拼接的工具,在处理重复片段时,都是采用对大量的片段数据进行反复迭代的方法,此间还需要加入很多人工的经验分析和干预。一定程度上增加了拼接所花费的时间,降低了机器的使用效率。 所以,在使用过程中,我们应该选择可以屏蔽重复片段的拼接算法。 2、如何去掉序列中重复的部分 基于特征子串的重复片段屏蔽方法: DNA 序列和每一个片段序列都可以看做是字符集{A,C,T,G}上的字符串,每个长为k的字符串称为k-串;若它是某个片段(或序列)的一部分,则称它为此片段(或序列)的k-子串. 特征子串:当一个k-子串为某个片段的标识性信息时,称该k-子串为该片段的特征子串。 PL条件:两片段含有至少一个公共的特征子串,称之满足可能相邻(PL)条件。 经计算,k需满足条件: 其中n为要拼接片段的总数。 2、如何去掉序列中重复的部分 算法原理: 即使两个本不相邻的片段因为重复片段的原因存在很长的重叠,但只要它们的特征子串均不相同,处理时就不会对它们进行比对,也就不会认为它们是相邻的。这样就达到了“屏蔽”重复片段干扰的目的,也为后续的拼接产生了有用的依据。 二、功能基因组学(functional genomics) 功能基因组学的概念: 功能基因组学(Functuional genomics)又往往被称为后基因组学(Postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。 功能基因组在评估和检测新药时十分有用。

文档评论(0)

Vens + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档