- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式环境下大规模图数据上距离查询研究-计算机科学与技术专业论文
国内图书分类号:TP393.02 学校代码:10213 国际图书分类号:004.9 密级:公开
工学硕士学位论文
分布式环境下大规模图数据上 距离查询研究
硕士研究 生:
赵振财
导 师
:
骆吉洲
申 请 学 位
:
工学硕士
学 科
:
计算机科学与技术
所 在 单 位
:
计算机科学与技术学院
答 辩 日 期
:
2013 年 6 月
授予学位单位
:
哈尔滨工业大学
Classified Index: TP393.02 U.D.C: 004.9
Dissertation for the Master Degree in Engineering
DISTANCE QUERIES ON LARGE-SCALE GRAPHS BASED ON DISTRIBUTED ENVIRONMENT
Candidate:
Zhencai Zhao
Supervisor:
Jizhou Luo
Academic Degree Applied for:
Master of Engineering
Speciality:
Computer Technology
Affiliation:
School of Computer Science and Technology
Date of Defence:
June, 2013
Degree-Conferring-Institution:
Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
哈尔滨工业大学工学硕士学位论文
-
-I-
摘 要
社交网络分析、网络舆情发现等应用发展迅速,这些应用所基于的图结构规 模也越来越大,在对图结构的研究中,对亿万个顶点级别的大规模图的处理能力 的需求愈加迫切。因为如今图的规模太大,使得最短路径查询问题变得更加具有 挑战性,其中包括大规模图结构的存储以及查询的效率等挑战性问题。传统的串 行算法在处理大规模图结构时面临着巨大的问题。众所周知,云计算的发展与大 规模数据的处理关系紧密。所以运用云计算环境,在大规模图上进行数据处理是 一个十分有潜力的研究方向。最近几年,Hadoop 是一个十分典型的云计算平台 代表。于是,我们可以基于 Hadoop 来对我们的问题进行研究。
本文主要结合云计算相关知识以及社交网络、交通网络实际应用,对大规模 图上的距离查询经典问题进行研究。本文首先针对实际应用提出并行化的经典
Floyd 类矩阵乘法算法 D-Floyd,并将该算法在 Hadoop 平台上进行实现。D-Floyd 算法主要采用 Hadoop 中的 MapReduce 和 HDFS 两部分来将经典 Floyd 算法在分
布式环境下进行实现。接着,我们对 D-Floyd 进行优化扩展,优化方案主要从
D-Floyd 算法本身和 Hadoop 平台两个方面入手进行考虑。然后我们研究了支持 增量计算的 D-Floyd 算法,根据研究,我们定义“有界”和“无界”,提出部分 增量的 D-Floyd 和完全增量的 D-Floyd。我们将算法与已有的 OptHCL-2 方法、 NaiveHCL 方法、BSC2Hop 方法进行多角度的分析比较,阐述分布式方案的必要 性及优点。接下来,我们提出 BFS 计算无权图中最短路径的分布式解决方案并 将其在 Hadoop 平台上进行实现,并与 D-Floyd 进行分析比较。通过试验分析, 我们提出的 D-Floyd 算法显然要比已有的单机串行算法高效,而且优化后的 D-Floyd 算法和增量式 D-Floyd 算法的相关研究提出的方法都在一定程度上提高 了 D-Floyd 算法的性能。此外,在无权图中 D-BFS 比 D-Floyd 性能要好很多, 于是在实际的应用中,当要处理的图为无向图时,可以采用 D-BFS 方案进行计 算,当要处理的图为有向图时,则只能采用 D-Floyd 方案进行计算。最后我们结 合现有的一些经典算法如 A*寻路算法、B*算法等在分布式架构上实现的思路, 提出展望并实现相关应用。比如,我们可以将解决方案运用到社交网络人物关系 图谱分析、网络舆情传播控制模型发现等应用中。
关键词:分布式计算;大规模图;Hadoop;社交网络;
-
-II-
Abstract
As the development of various applications based on social networks and traffic networks, large-scale graph processing has become increasingly popular. But because the scale of graph is so big that shortest di
您可能关注的文档
- 典型城市近地面O3浓度演化的自组织动力机制-生态学专业论文.docx
- 典型复杂网络的最短路径统计特性分析-计算机应用技术专业论文.docx
- 典型多环芳烃污染土壤生物修复-环境科学专业论文.docx
- 典型室内场景下无线多跳网络阴影衰落相关性建模-信息与通信工程专业论文.docx
- 典型大气条件下架空输电导线磨损特性研究-机械制造及其自动化专业论文.docx
- 典型家具可持续设计研究-设计艺术学专业论文.docx
- 典型密码模块的研究与应用-密码学专业论文.docx
- 典型封装芯片的热阻网络模型研究-精密仪器及机械专业论文.docx
- 典型小流域水土保持基础效益分析研究——南水北调中线工程水源区桃花谷小流域为例-环境工程专业论文.docx
- 典型局域网的故障树风险决策分析-工商管理专业论文.docx
- 2024年度党员干部民主生活会班子对照检查材料.docx
- 公司党委领导班子2024年度民主生活会对照检查材料4个带头方面.docx
- 市府办(政府办)领导班子2024年民主生活会会后综合情况报告.docx
- 在2025年市司法局信息宣传工作推进会上的讲话.docx
- 在2025年全省文化旅游高质量发展推进会上的讲话.docx
- 在2025年全区工业、住建大规模设备更新推进会上的讲话.docx
- 党支部2024年组织生活会民主评议党员情况总结报告_1.docx
- 2024年度组织生活会个人对照检查剖析材料.docx
- 镇党委书记2024年度民主生活会对照检查材料1.docx
- 党支部2024年组织生活会民主评议党员情况总结报告.docx
文档评论(0)