蛋白质相互作用网络在蛋白质功能预测中的应用.docVIP

蛋白质相互作用网络在蛋白质功能预测中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质相互作用网络在蛋白质功能预测中的应用

蛋白质相互作用网络在蛋白质功能预测中的应用 来源:中国论文下载中心????[ 10-02-05 09:18:00 ]????作者:朱薿????编辑:studa20 ????? 【关键词】? 基因 ??? 人类基因组计划(human genomic project, HGP)大规模测序工作的完成标志生命科学的研究将进入后基因组时代(postgenomic era)。由于蛋白质是生理功能的执行者以及生命现象的体现者,对蛋白质功能的研究将成为后基因时代研究的核心内容之一。伴随着生物信息学的迅猛发展以及基因表达谱和蛋白质相互作用数据的激增,利用计算方法对蛋白质功能进行预测和注释成为越来越有效的一种手段[1]。目前应用较为广泛的蛋白质功能预测主要基于以下几方面:同源序列、基因组对比、系统进化特征谱、基因表达谱数据以及蛋白质相互作用网络等。由于基于蛋白质相互作用网络的功能预测能整合多种数据信息,并具有从整体水平上准确预测蛋白质功能的优点,该方法已成为蛋白质功能分析及预测中的热点[2,3]。 ??? 1? 蛋白质相互作用网络及其构建 ??? 对生物学认识的加深使得人们认识到生命活动的大多数过程是由许多的分子共同作用所引发的。此时再单纯地研究单个分子之间的相互作用显然无法从整体上阐明这种复杂的相互作用以及调控结果。因此,目前蛋白质相互作用的研究重点正逐渐从单个分子转向许多分子间的相互作用以及由它们所形成的复杂网络,并通过这种网络试图去揭示生命过程所涉及的分子组成、反应通路以及调控机制等一系列问题。 ??? 构建蛋白质相互作用网络首先需要获取蛋白质相互作用的数据。目前已有大量的蛋白质相互作用数据库,比如DIP(Database of Interacting Proteins)[4],BIND(Biomolecular Interaction Network Database)[5]等。根据这些数据库中提取的蛋白质相互作用数据,人们可以构建相应的相互作用网络。在相互作用网络中,一般用节点(node)来表示蛋白质,而连接两个节点的边(edge)表示蛋白质之间是否存在相互作用关系。目前,不同的研究组已成功地获得了H.pylori,S.cerevisiae,C.elegans和D.melanogaster等模式生物的部分蛋白质相互作用网络。 ??? 2? 蛋白质相互作用网络用于功能预测 ??? 传统的蛋白质功能注释及预测方法是根据蛋白质相关的一些统计特征集,利用机器学习方法来得出功能注释的规则用于预测。蛋白质功能实现的复杂性以及功能定义的模糊性,使得传统的利用特征预测的方法很难准确的进行预测。而蛋白质相互作用网络能够利用蛋白质之间的相关性,对未知功能的蛋白质进行注释。目前,利用相互作用网络进行功能注释主要有两种方法,即直接注释方法(direct annotation schemes)[4,6]和基于模块的方法(moduleassisted schemes)[7,8]。 ??? 2.1? 直接注释方法 ??? 直接注释方法根据网络中某个蛋白质的连接情况直接推测该蛋白质的功能。这类方法基于的假设是:在蛋白质相互作用网络中,距离相近的两个蛋白质更加倾向于拥有相似的功能。而通过两蛋白质在网络中的距离来计算并判断这两个蛋白质功能相似性有许多的方法。 ??? 2.1.1? 邻居节点计算法(neighborhood counting) ??? 这种方法是最简便也是相对较早出现的方法。它根据网络中某个蛋白质直接相关的邻居已知蛋白质的功能来确定该未知蛋白质的功能注释[6]。这种方法假设某未知蛋白质的邻居中有超过n个蛋白质具有一样的功能,就将这种功能赋予给该蛋白质。这种方法虽然简单并且有时候非常有效,然而它在功能注释过程中不能为这种关联性提供非常有显著意义的解释,并且它也没有考虑到网络的全局拓扑结构。 ??? 2.1.2? 图论方法(graph theoretic method) ??? 图论方法不同于邻居节点计算法,它可以考虑网络的全局拓扑结构。Vazquez[4]等首先采用基于分割的方法(cutbased approaches)将图论法引入蛋白质功能注释研究中。其基本思路是:对一个未知功能蛋白质赋予某种功能,要使得注释为相同功能的蛋白质(未注释或者已注释)的连接数目最多。 ??? 基于分割的方法虽然可以很好地考虑网络的全局特性,但是它并未强调局部接近对功能相似性的贡献。因此,Nebieva等[9]人又提出一种基于流的网络分析方法(flowbased approaches),这种方法将每个蛋白质功能的注释都看作是一个“功能流”资源。在模拟功能流在网络中随时间传播时,根据模拟过程中未知功能蛋白质接收到的流的数目来确定注释结果。这种方法可以很好地协调网络中局部和全

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档