数据挖掘基础及其应用 课件 第12章 生物网络挖掘.pptx

数据挖掘基础及其应用 课件 第12章 生物网络挖掘.pptx

第12章 生物网络挖掘; 12.1 引言;   基于稠密子图的复合体提取算法仅考虑到网络的一个拓扑指标,并没有考虑复合体的内部结构。最近,Gavin等人证明了复合体由核心与附属蛋白质组成,如图12-1所示。核 附属结构为复合体检测方法提供了新的思路,可分别提取核部分与附属部分。相对于附属部分而言,核部分的蛋白质是复合体心脏部位。本章的主要研究动机是:利用核 附属结构建立相应的概率模型来检测蛋白质复合体;基于拓扑关系检测复合体。基于核 附属结构的方法取得了优异的性能,表明了核 附属结构有助于更加准确地提取复合体。;; 12.2 相 关 工 作;   相对于拓扑刻画问题,更多的研究人员关注第二个问题——复合体检测算法。MCODE算法是基于网络拓扑结构信息检测复合体的经典方法之一,它分三步:首先,利用节点局部密度对节点进行赋权;然后,选取权重大的节点作为种子节点;最后,从种子节点出发向周围节点进行添加,直到这些聚类的密度小于事先设定的阈值。MCODE 算法最大的缺陷在于所检测出来的复合体数过少,且复合体规模过大。而 MCL 算法利用随机游走模型来提取复合体,其缺点与 MCODE 方法的类似。与 MCODE 算法不同,DPClus算法首先对每一条边进行赋权,然后根据边的权重对每个节点赋权。;   团作为一种重要的网络拓扑结构也被广泛应用于复合体检测中。CFinder算法利用派系过滤方法(C

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档