- 1、本文档共91页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式图计算系统的容错机制研究-软件工程专业论文
万方数据
万方数据
Submitted in total ful?lment of the requirements for the degree of Master in Software Engineering
Research about Fault-tolerance for Large-scale Graph Processing
P??? W???
Supervisor Prof. H???? C???
S????? ?? E?????????? I?????????? ??? E????????? E??????????, S????? ?? S???????
S??????? J??? T??? U????????? S???????, P.R.C????
Jan. 12, 2015
上海交通大学 学位论文原创性声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研 究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人 和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本 人承担。
学位论文作者签名:
日 期: 年 月 日
上海交通大学 学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
保 密 □,在 年解密后适用本授权书。 本学位论文属于
不保密 □。
(请在以上方框内打“?”)
学位论文作者签名: 指导教师签名:
日 期: 年 月 日 日 期: 年 月 日
上海交通大学硕士学位论文 摘要
分布式图计算系统的容错机制研究
摘 要
现实世界中许多计算都涉及到大图,例如社交网络中朋友圈的分析工作。 为了高效地分析图结构这类数据,谷歌公司提出了“像顶点一样思考”的图计 算。图计算,凭借其强大的表达能力和高效的执行效率,逐渐被广泛用在网页 搜索、自然语言处理、推荐系统等各个领域。为了应对现实世界中越来越复杂 的算法和越来越大的数据集,现有的图计算系统大多设计为分布式系统。例如, 谷歌公司已经用成百上千台机器来运行相关数据挖掘算法。由于运行在分布式 环境下,图计算在运行过程中可能随时出现宕机、断电等异常情况,图计算系 统需要提供机制来容忍这些异常的发生。本文的主要贡献如下:
第一,通过实验详细分析了图计算现有的容错机制所存在的问题 由于顶点上复杂的计算和顶点间复杂的依赖关系,现有的图计算系统主要
采用为整个系统记录快照的方式进行容错。该机制存在两个问题:对于平时执
行,它会引入很大的执行开销;对于故障恢复,它需要很长的恢复时间。采用 该机制的系统,在平时执行过程中,需要定期地将当前计算的状态记录到分布 式文件系统中。当有故障发生后,系统会从最近的快照中恢复出计算状态,然 后重新开始计算。由于记录快照和从快照中恢复计算状态的过程涉及许多费时 的网络请求,基于分布式快照的容错机制的执行开销比较大,恢复速度却比较 慢。由于上述两个原因,在图计算真实运行中,即使系统提供了该容错机制, 它也往往不被使用。
第二,提出并实现了一个全新的利用顶点副本进行容错的机制 分布式图计算系统会为一个顶点建立副本来服务其远端邻居的计算,这些
副本拥有原顶点的许多的状态,可以很方便地被用来为系统提供容错支持。基
于以上观察,本文提出了一个新的基于副本的容错机制 Imitator。Imitator 可 以在引入很小执行开销的情况提供容错支持,同时它的恢复速度比较快。这是 因为 Imitator 采用了如下设计:
— i —
分布式图计算系统的容错机制研究 上海交通大学硕士学位论文
? Imitator 尽可能地复用原有机制来降低执行开销,Imitator 利用原有副本来
备份顶点状态,同时它通过扩展已有同步机制来保证副本顶点与原顶点
的状态是一致的;
? Imitator 利用整个集群的硬件资源进行并行恢复,Imitator 通过选择副本位 置,在恢复过程中,它尽可能地将恢复工作均分到各个机器上,充分利用 整个集群的硬件资源进行恢复。
测试表明,Imitator 可以在引入很小执行开销的情况下(对于所有测试算 法都小于 5%)提供容错支持,同时它的恢复速度比较快,比基于分布式快照 的容错机制快 3.55~17.67 倍。
关键词: 图计算 容错 恢复 副本
— ii —
上海交通大学硕士学位论文 ABSTRACT
Research about Fault-tolerance
您可能关注的文档
- 公路改扩建工程项目管理关键技术研究-交通运输规划与管理专业论文.docx
- 公路桥梁全寿命周期成本分析-桥梁与隧道工程专业论文.docx
- 公路改造新理念在山区道路设计中的应用-交通运输工程专业论文.docx
- 公路桥梁全寿命周期成本研究-结构工程专业论文.docx
- 公路桥梁动力响应灵敏度研究-桥梁与隧道工程专业论文.docx
- 公路桥梁侧风行车安全对策的数值方法研究-桥梁与隧道工程专业论文.docx
- 公路桥梁大直径钻孔灌注桩轴向承载力优化设计研究-岩土工程专业论文.docx
- 公路桥梁在多车激励作用下车桥耦合振动响应研究-建筑与土木工程专业论文.docx
- 公路洪水灾害风险评价研究-道路与铁道工程专业论文.docx
- 公路桥面沥青混凝土铺装层性能评价-载运工具运用工程专业论文.docx
文档评论(0)