- 10
- 0
- 约4.64千字
- 约 6页
- 2017-08-30 发布于安徽
- 举报
【大数据分析分享系列】
之数据库离线挖掘计算模型
目 录
1、以节点为中心的编程模型 1
2、GAS 编程模型 2
3、同步执行模型 3
4、异步执行模型 3
对于离线挖掘类图计算而言,目前已经涌现出众多各方面表现优秀而各具特
点的实际系统,典型的比如 Pregel、Giraph、Hama、PowerGraph、GraphLab、
GraphChi 等。通过对这些系统的分析,我们可以归纳出离线挖掘类图计算中一
些常见的计算模型。
本节将常见的计算模型分为两类,一类是图编程模型,另一类是图计算范型。
编程模型更多地面向图计算系统的应用开发者,而计算范型则是图计算系统开发
者需要关心的问题。在本节中,关于编程模型,主要介绍以节点为中心的编程模
型及其改进版本的GAS 编程模型;关于计算范型,则重点介绍同步执行模型和异
步执行模型。这几类模型已经被广泛采用在目前的大规模图挖掘系统中。
1、以节点为中心的编程模型
以节点为中心的编程模型(Vertex-CenteredProgrammingModel )首先由
Pregel 系统提出,之后的绝大多数离线挖掘类大规模图计算系统都采用这个模
型作为编程模型。
对图 G=(V,E)来说,以节点为中心的编程模型将图节点 vertexÎV 看作计算
的中心,应用开发者可以自定义一个与具体应用密切相关的节点更新函数
Function(vertex),这个函数可以获取并改变图节点vertex 及与其有关联的边
的权值,甚至可以通过增加和删除边来更改图结构。对于所有图中的节点都执行
节点更新函数 Function(vertex)来对图的状态(包括节点信息和边信息)进行
转换,如此反复迭代进行,直到达到一定的停止标准为止。
典型的图节点更新函数Function(vertex)基本遵循如下逻辑。
即首先从vertex 的入边和出边收集信息,对这些信息经过针对节点权值的
函数f()变换后,将计算得到的值更新 vertex 的权值,之后以节点的新权值和
1
边原先的权值作为输入,通过针对边的函数g()进行变换,变换后的值用来依次
更新边的权值。通过vertex 的节点更新函数,来达到更新部分图状态的目的。
以节点为中心的编程模型有很强的表达能力。研究表明,很多类型的问题都
可以通过这个编程模型来进行表达,比如很多图挖掘、数据挖掘、机器学习甚至
是线性代数的问题都可以以这种编程模型来获得解决。这也是为何以图节点为中
心的编程模型大行其道的根本原因。
2、GAS 编程模型
GAS 模型可以看作是对以节点为中心的图计算编程模型的一种细粒度改造,
通过将计算过程进一步细分来增加计算并发性。GAS 模型明确地将以节点为中心
的图计算模型的节点更新函数 Function(Vertex)划分为三个连续的处理阶段:
信息收集阶段(Gather)、应用阶段(Apply)和分发阶段(Scatter)。通过这种
明确的计算阶段划分,可以使原先的一个完整计算流程细分,这样在计算过程中
可以将各个子处理阶段并发执行来进一步增加系统的并发处理性能。
这里假设当前要进行计算的节点是u,并以此为基础来说明GAS 模型。
在信息收集阶段,将u 节点的所有邻接节点和相连的边上的信息通过一个通
用 累 加 函 数 收 集 起 来 :
通过以上三个阶段的操作,可以定义以图节点为中心的高度抽象的GAS 计算
模型。在GAS 模型中,节点的入边和出边在信息收集和分发阶段如何使用取决于
2
具体的应用,比如,在PageRank 计算中,信息收集阶段只考虑入边信息,分发
阶段只考虑出边信息,但是在类似于Facebook 的社交关系图中,如果边表达的
语义是朋友关系,那么在信息收集和分发阶段则是所有边的信息都会纳入计算范
围。
3、同步执行模型
您可能关注的文档
- 1CBD工程项目施工过程中安全分析报告.doc
- “文化”与“产业”空间格局构建解析.doc
- “增效海棠美”疗效评价及实验室的研究.doc
- 《极限突破》2012年七年级地理上册 第一章 第二节 地球运动配套课件 人教新课标版.ppt
- 《循环经济与低碳经济》网上考试答案.doc
- 《匀变速直线运动位移与时间关系》教案.doc
- 【2011考研】南京理工大学863有机化学全部核心考点讲义.doc
- 【2012优化方案】数学(苏教版必修3)课件精品:第2章本章优化总结.ppt
- 【超给力】基于多元利益主体诉求情景规划_以酒_泉_嘉_峪关_区域一体化空间布局为例.pdf
- 【创新方案】2014年高考生物一轮复习课时达标检测:第十八章 第三讲 生态系统信息传递和稳定性.doc
- 【发酵工程】余龙江版 第15章_发酵产品生产原理与技术应用.ppt
- 【红对勾】2014届高考生物一轮复习课时作业39(含解析).doc
- 【湖南师大附中内部资料】高三地理总复习课件:(中国自然资源.ppt
- 【教与学】2014高考物理总复习教案18: 电磁感应中动力学和能量问题.doc
- 【精品强烈推荐】2014届中考物理二轮精品复习专题卷:分子热运动(16页,含2013年模拟试题,含答案和解析).doc
- 【精品资料】高考化学基础知识大总结(史上最全).doc
- 【名师导学】2014高考物理一轮 1.4运动图象、追及与相遇问题课件.ppt
- 【全程复习】2014高考化学 (难点聚焦+例题精讲+实战演练)镁和铝考点归类整理.doc
- 【全程复习】2014届高考物理第一轮复习方略 :1.1描述运动基本概念课时提能演练(含解析) 新人教版.doc
- 【全程复习方略】2013-2014学年高中物理 电场强度课件 新人教版选修3-1.ppt
原创力文档

文档评论(0)