蛋白质相互作用网络中模块识别算法的研究.pdf

蛋白质相互作用网络中模块识别算法的研究.pdf

摘要 随着预测蛋白质相互作用技术的提高,产生了大量的数据,这些数据一般被 表示为复杂网络的形式,因此迫切需要引入高效的计算的方式来对这些数据进行 分析。研究表明,蛋白质不是以单体的形式进行工作,而通常以模块结构来发挥 它的功能。辨识蛋白质相互作用网络中的模块结构对理解生物系统的结构和功能 有着十分重要的意义。以往的识别模块的算法主要是从网络中检测出高密度的子 图,但是忽略了蛋白质模块本身的组织结构,在识别的精度和效率上都有待提高。 因此,本论文的主要工作如下: 1.基于核心附件模型实现了一种具有较高精度的贪心模块识别算法。本文 基于核心附件模型,提出了一种新的边的权重计算方法,利用贪心搜索算法首先 从网络中挖掘内部存在较多相互作用的稠密子图作为核心,然后为核心挑选高相 关性的附件蛋白质,从而形成功能模块。实验结果的分析表明,所得到的模块中 的蛋白质在功能上和生物过程上有着密切的关系,绝大多数的模块都表现出非常 显著的GO相关性,并且很多的模块与一些己知的蛋白质复合体相匹配,同时, 可以找出重叠的模块。 2.把贪心思想和层次聚类相结合提出了一种快速聚类算法。目前的方法在 进行层次聚类的过程中需要重复计算边的权重,因此效率不高,而且不能很好的

文档评论(0)

1亿VIP精品文档

相关文档