- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图数据库-架构与算法.pdf
14
图数据库:架构与算法
董小姐 我也是个复杂的动物
嘴上一句带过 心里却一直重复
董小姐 鼓楼的夜晚时间匆匆
陌生的人 请给我一支兰州
——宋冬野《董小姐》
图计算是一类在实际应用中非常常见的计算类别,当数据规模大到一定程度时,如何对其进行
高效计算即成为迫切需要解决的问题。最常见的大规模图数据的例子就是互联网网页数据,网页之
间通过链接指向形成规模超过 500 亿节点的巨型网页图。再如,Facebook 社交网络也是规模巨大的
图,仅好友关系已经形成超过 10 亿节点、千亿边的巨型图,考虑到 Facebook 正在将所有的实体数
据节点都构建成网状结构,其最终形成的巨型网络数据规模可以想见其规模。要处理如此规模的图
数据,传统的单机处理方式显然已经无能为力,必须采用由大规模机器集群构成的并行图数据库。
在处理图数据时,其内部存储结构往往采用邻接矩阵或邻接表的方式,图 14-1 是这两种存储方
式的简单例子示意图。在大规模并行图数据库场景下,邻接表的方式更加常用,大部分图数据库和
处理框架都采用了这一存储结构。
图数据与大数据处理中常见的 KV 数据相比,有自身独有的特点,这也决定了其处理机制与其
他类型的海量数据处理系统有很大的差异。具体而言,图数据的数据局部性很差,相互之间有很密
切的关联,具体体现就是图节点所展现出的边,其表征着数据之间的关联。很多自然图的结构遵循
Power Law 规则,满足 Power Law 规则的图数据分布极度不均匀,极少的节点通过大量的边和其他
众多的节点发生关联。这给分布式存储和计算带来很大的困难,因为数据局部性差意味着数据分布
大数据日知录:算法与架构
到集群中的机器时存在潜在的数据分布不均匀或者计算中需要极高的网络通信量等问题。
邻接矩阵
Adjacency matrix B C
A B C D E
1
∞ ∞
A 10 5
B 1 2 10
A
C 4
D 3 9 2 0 2 3 9 4 6
E 7 6
5 7
邻接表
Adjacency List
A: (B, 10), (D, 5) ∞ ∞
2
B: (C, 1), (D, 2)
D E
C: (E, 4)
D: (B, 3), (C, 9
您可能关注的文档
最近下载
- 行进间低手投篮教案.doc VIP
- (正式版)H-Y-T 250-2018 无居民海岛开发利用测量规范(正式版).docx VIP
- “增材制造项目”—第二届职业技能大赛甘肃省选拔赛—技能试卷(样题).pdf VIP
- 日照城市介绍PPT模板.pptx VIP
- DLT 5219-2023 架空输电线路基础设计规程.pdf VIP
- 附睾炎护理查房.pptx VIP
- 跨学科实践“用'水透镜'探究近视眼的形成原因”(教学课件)物理沪粤版2024八年级上册.pptx VIP
- 2025年新人教版语文八年级上册全册教学设计.docx
- 华为认证ICT工程师HCIA考试(习题卷5).pdf VIP
- 招商运营专员岗位面试题及答案.docx VIP
原创力文档


文档评论(0)