- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网络拓扑属性蛋白质相互作用预测
基于网络拓扑属性蛋白质相互作用预测
摘要: 蛋白质必须通过与其它蛋白质之间的相互作用才能行使其功能,因此,对蛋白质相互作用的研究显得尤为重要。针对蛋白质相互作用的预测问题,文中选取DIP数据库中21034对酵母蛋白进行蛋白质相互作用预测,以四个基于网络拓扑结构的相互聚类系数(Jaccard Index、Meet/Min、Geometric 和 Hypergeometric)和基于相互作用一般性的IG2( New Interaction Generality)算法作为预测蛋白质相互作用的五个属性,并利用Weka中朴素贝叶斯分类法计算蛋白质相互作用网络在这五种属性共同作用下的准确值。并将实验结果与蛋白质生物学特征同源(Homologs)、基因本体GO(Molecular Function、Biological Process和Cellular Component)属性相比较,得出本实验方法具有可行性,给蛋白质相互作用的预测带来指导意义。
关键词:蛋白质相互作用 网络拓扑 朴素贝叶斯分类法
1、引言
蛋白质相互作用是指一个蛋白质与另一个蛋白质之间的相互关系。通常蛋白质相互作用不是孤立的,而是相互交织在一起,形成一个庞大的复杂的网络。研究蛋白质相互作用网络不仅能帮助人们理解生命体活动的特征,还可以预测未知蛋白的功能[1]。
随着高通量生物实验技术的应用,如酵母双杂交法、质谱法、蛋白芯片技术,人们获得了大量的蛋白质相互作用数据。然而,实验方法获得的结果中通常包含大量的假阳性和假阴性数据,并且这类方法获得的数据不够全面。因此,需要有效的计算方法来预测蛋白质相互作用。现有的预测方法主要依据相互作用的蛋白质在其序列、结构、domain、功能、进化信息、亚细胞定位等方面有着相近或相同的特征,通过研究这些特征来预测蛋白质相互作用。并且国内现有的预测方法主要集中在分类算法和基于单一数据源的研究。
本文针对蛋白质相互作用网络拓扑结构进行研究,主要是对普遍存在的网络拓扑性质及其背后隐藏的动力学机制,提出了小世界性质和无标度分布等网络拓扑属性。蛋白质相互作用网络已经被证明具有小世界性质和无尺度分布。Goldberg[2]等根据蛋白质相互作用网络满足小世界网络这一性质,对每条边提出了相互聚类系数(Mutual Clustering Coefficient,MCC)的概念,并计算出每条边的相互聚类系数值,规定一个阈值,在此阈值之上的PPI被认为是可靠的。Saito等[3]相继提出了两个基于相互作用一般性(Interaction Generality, IG)的概念IG1和IG2。本文实验结果表明利用拓扑结构信息能够有效地剔除假阳性的蛋白质相互作用数据,得到更为可靠的蛋白质相互作用网络。本文就采用相互聚类系数(其中从四个不同角度来计算每条边的聚类系数)和IG2算法共五种属性值共同来预测蛋白质相互作用[4]。
2、属性值的计算
2.1 MCC
Watts and Strogatz 根据小世界网络具有比较高的聚类系数,如图1所示,对一个图定义了MCC。用的平均值定义图的聚合系数,在这些定义中,N(x)代表顶点x的邻居,Total代表有机体中蛋白质的个数。对两个顶点V和W,定义MCC分别如式1、式2、式3、式4所示:
图1 小世界网络中的聚合邻居
(a)在小世界网络中,顶点的邻居们比在随机图中的更容易形成三角形,用点线标注
(b)一条边的两个顶点有相同的邻居,也形成三角形
2.2 IG2
IG2是在IG1的基础上做了很大的改进。IG1用来预测已被实验证实的蛋白质间相互作用的可靠性。其思想是:如果存在相互作用的蛋白质有很多其它的相互作用对象,但这些对象之间却没有交互,则很可能就是假阳性。IG1没有考虑拓扑属性。IG2克服了IG1的缺陷,它可以预测推断的蛋白质之间相互作用的可靠性,而且可以得到很高的精确结果。IG2计算过程是:假设目标边是相互作用A-B,如果蛋白质C直接与A-B相互作用,根据相互作用网络的拓扑属性,那么它就被分到五组中的一组,设五组为(a1,a2,l,f,d)。当C与A和B都相互作用时,它被分为a1;当C只与A-B中的一个相互作用,但C与另外一个蛋白质相互作用且这个蛋白质与A-B中的另外一个蛋白质相互作用时分到a2;当C没被分到a2,它与A相互作用但不和B相互作用,但是它与至少一个与A相互作用的一个蛋白质相互作用,他分到l组;如果C没被分到以上三组,C与另外一个蛋白质相互作用,这时被分到f组;如果C不与AB外的任何蛋白质相互作用,那么它被分到d组里如图2所示。
图2 把与目标蛋白对A-B有作用的蛋白质C分类
3、结果与分析
3.1实验数据
您可能关注的文档
- 基于Web远程数据库管理探究.doc
- 基于Wi—Fi DirectWLAN和TD—LTE共存探究.doc
- 基于WebSocket与SenchaTouch移动Web应用设计和实现.doc
- 基于WSH框架供电局网站设计.doc
- 基于WSR系统方法论工程施工合同管理系统研究.doc
- 基于ZigBee油井载荷监测系统设计.doc
- 基于ZigBee智能节能灯控系统设计.doc
- 基于《考试说明》备考复习策略.doc
- 基于三层架构高校管理系统设计和实现.doc
- 基于三方进化博弈药品回收逆向物流研究.doc
- 2025四川天府银行社会招聘备考题库(攀枝花)含答案详解(最新).docx
- 2025四川银行首席信息官社会招聘备考题库及完整答案详解1套.docx
- 2025四川天府银行社会招聘备考题库(攀枝花)带答案详解.docx
- 2025四川天府银行社会招聘备考题库(成都)含答案详解(a卷).docx
- 2025四川广元市利州区选聘社区工作者50人备考题库及答案详解(基础+提升).docx
- 2025天津银行资产负债管理部总经理或副总经理招聘1人备考题库含答案详解(典型题).docx
- 2025四川天府银行社会招聘备考题库(西充)附答案详解(考试直接用).docx
- 2025年中国民生银行南宁分行招聘2人备考题库及答案详解(全优).docx
- 2025天津银行高级研究人才招聘备考题库附答案详解(达标题).docx
- 2025大连银行营口分行招聘2人备考题库及参考答案详解一套.docx
原创力文档


文档评论(0)