第四序列分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四序列分析

* BIOINFORMATICS 数理与生物工程学院 * 但是,完全基于序列之间的相似性进行蛋白质家族的分类显然过于绝对。Doolittle等人随后提出蛋白质超家族由2个或以上家族组成,推理自全体蛋白质来自于一群数目较少的原始蛋白质。由于分子进化过程中,组成一个蛋白质序列的所有氨基酸并不具备同样的进化速率,具有重要功能位点的氨基酸显然进化较慢,因而,单纯基于序列相似性分析对蛋白质家族进行判断并不合理。 * BIOINFORMATICS 数理与生物工程学院 * 同时,蛋白质进化过程中实际上也反映出重要氨基酸组群进化速率较慢而形成的保守性。这一结果体现在很多蛋白质家族成员中蛋白质序列之间的相似性可能只局限于某个序列区域或结构域中。因此,蛋白质超家族的概念现已发展为具有某种共同结构域的所有分子组成的分子集合。这一概念将蛋白质超家族进行了扩大。 * BIOINFORMATICS 数理与生物工程学院 * 这一点也反映在PDB数据库的处理中,即PIR数据库不只依据序列的相似性,而且还结合结构域的分析进行蛋白质家族和超家族分类。 如果发现一个未知蛋白质序列和较多不同种属或同一种属的蛋白质序列具有较高的同源性(大于50%),那么提示待分析的蛋白质序列可能是相应家族的成员,从而可以从分子进化的角度对蛋白质序列进行综合分析。 * BIOINFORMATICS 数理与生物工程学院 * 蛋白质的分子进化分析基本包括以下步骤: 1.用待分析的蛋白质序列检索蛋白质序列数据库,获 取同源性较高的蛋白质序列;此过程可直接通过NCBI/BLASTP软件进行; 2.将所有相关的序列组织成FASTA格式,作为后续进行Clustal W/X软件分析的输入数据; 3.采用Clustal W/X算法对这些序列进行聚类分析;此种分析可通过联网“http://www.ebi.ac.uk/clustalw/”(图4-24)进行,或者直接使用Clustal W/X软件进行; 4.根据蛋白质序列多重比对的结果绘制分子进化树:进化树绘制一般用本地化的软件实现,包括苹果机版的Mac Vector、DNAMAN、TreeView等。 图4-24 蛋白质多重序列比对(Clustal W/X)的网络界面 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * * BIOINFORMATICS 数理与生物工程学院 * 疏水性分析 位于ExPASy的ProtScale程序(/ cgi-bin/protscale.pl)可被用来计算蛋白质的疏水性图谱。该网站允许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或者SWISS-PROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)。该参数用于估计每种氨基酸残基的平均显示尺度。 例如,如果参数n为9,则显示从5(=n-4)到13(=n+4)位之间其疏水性的平均值。该参数有助于对数据进行平滑,也可使亲水性和疏水性的区域更加突出。典型的默认值为9。 * BIOINFORMATICS 数理与生物工程学院 * 进行蛋白质的亲/疏水性分析时,也可使用一些Windows下的软件资源,例如BioEdit, DNAMAN等。图4-17中显示使用BioEdit软件采用Kyte和Doolittle算法对羊OPSD蛋白质进行亲/疏水性分析的结果,结果提示多个区域为疏水性区域。 图4-17 使用BioEdit软件对OPSD_SHEET蛋白质进行亲水/疏水分析结果示例 * BIOINFORMATICS 数理与生物工程学院 * 跨膜区分析 有多种预测跨膜螺旋的方法,最简单的是直接观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域。但是同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知跨膜螺旋的研究而得到的。自然存在的跨膜螺旋Tmbase数据库,可通过匿名FTP获得(http://www.isrec.isb -sib.ch/ftp-server/tmbas),参见表4-4。 表4-4蛋白质跨膜区域分析的网络资源 资源 名称 网址 说明 TMPRED /soft

文档评论(0)

little28 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档