图数据库基础知识(上).pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图数据库基础知识(上) 图数据库基础知识(上) 背景知识 图数据库的介绍 图数据库的 特点 图数据库应⽤场景 图数据库的术语 ⼀.图数据库的介绍 图数据库(英⽂:Graph Database)在传统意义上被归类为NoSQL(Not OnlySQL)数据库的⼀种,也就是说属于⾮关系型数据库,其 它的⾮关系型数据库在⼴义上还包含例如,键值数据库、⽂档数据库、列数据库、时序数据库等。 从数据科技(DT)、数据处理技术发展的趋势来看,过去的40年间,我们经历了从Data到Big Data 到Fast Data到Deep Data的四个阶 段。1980-2010年间的关系型数据库主导的阶段,2010-2020年间的⼤数据与快数据主导的云计算⼤数据时代,⽽未来的10年 (2020-2030)则可以预见的被认为是图计算、图数据库的时代。这是由商业驱动的本质来决定的,当企业IT信息化已经基本完成后,再 向前就是企业的全⾯智能化,⽽智能化时代的核⼼技术就是可以处理⾼维数据关联关系的图数据库或图计算与存储引擎,低维的SQL类型的 数据库注定会逐步消亡。 知名信息咨询公司Gartner在2019年11⽉和2020年6⽉的两份关于数据与分析科技(Data Analytics Technology Trends)的报告 中,明确的提出了图分析 (Graph Analytics,如下图所⽰)作为10⼤核⼼科技发展趋势之⼀,且其所代表的细分市场以年复合增长率 100%的速度持续增长,预计到2023年,30%的BI(商务智能、商业决策)会通过图分析与计算(既图数据库系统)来完成。 ⼆. 图数据库特点 图数据库的的所有特点都是相对于传统数据库⽽⾔的,尤其是关系型数据库。简单⽽⾔,图数据库的最⼤特点有3 个: 1.⾼维 2.⾼性能 3.⾼效率 相⽐于传统的关系型数据库中的关系表(⼆维表),图数据库采⽤的是可描述复杂关联关系的⾼维拓扑结构,既图论的理念,这也是图数据 库(Graph Database)名字的源头。⾼维的数据关联关系并不意味着性能降低、效率降低,恰恰相反,图数据库中的⾼维关系的构建只依 赖两⼤类最基础的数据类型:顶点与边,我们也通常称作实体与关系。⽤图数据库可以简单、⾼效、⾃由,并且⾮常⾃然的表达真实世界中 的关联关系。这种100%还原世界的能⼒,让图数据库⽐关系型数据库或其它类型的数据库或⼤数据处理框架可以更加快速、深度、准确的 挖掘事物间的关联关系,很多时候这种效率与性能的提升是指数级的,成千上万倍或者更多 (随着搜索深度的增加,相对的性能与效率的提 升会呈现指数级的差异增⼤)。 三.图数据库应⽤场景 我们可以从狭义场景与⼴义场景两个维度来阐述图数据库的应⽤场景。 狭义场景如上图所⽰的部分商业场景,例如在泛⾦融⾏业中,可以归纳为开源vs.节流这两⼤类场景,也可以泛化到任何⾏业中的普适场 景,⼀⽅⾯通过智能化营销的⼿段来获客 (捕获新客户)或促活 (促进客户活跃度,以实现更⾼的ARPU),另⼀⽅⾯通过智能化的节省开 ⽀或减少欺诈来实现更健康的企业运营。 在⼴义场景中,或者说图数据库的长期发展趋势中,它必将全⾯取代关系型数据库。当图数据库的⾼效、⾼能、⾼维被越来越多的商业场景 所采⽤,越来越多的企业认识到通过它可以实现更好的ROI,更低的TCO后,以及在核⼼的场景中(例如⾦融交易)可被证明其效率与稳定 性后,关系型数据库被取代只是个时间问题。在那之前,眼下我们看到越来越多的BI、商业决策、风控、知识图谱、可解释AI、区块链、供 应链⾦融、产业互联⽹等场景中看到图数据库、实时图计算与分析的⾝影,这个趋势不可逆转。 四.图数据库术语 GQL Graph Query Language,即图数据库的查询与管理语⾔。在SQL标准已经发展40年后才迎来了数据库领域的第⼆个标准,这就是 GQL,预计GQL的第⼀版国际标准在2022年中发布。 点(node) 称之为顶点(Vertex)或点(node),也可以称作实体(Entity)。 边(edge) 连接两个点(node)的边,分为1)⽆⽅向,2)有⽅向(见下⾯⽅向的解释)。在知识图谱范畴内也常被称作关系(relation、 relationship)。 路径(path) 多个相连的边(包括边连接的点)构成的⼀个序列称为⼀条路径,例如a–b--c,单独的⼀条边也是⼀个路径。 ⼦图(subgraph) ⼦图相对于全图(完整图数据集合)⽽⾔,是由全图的部分顶点和边组成,例如每⼀次查询结果可以作为⼀张⼦图。 属性

文档评论(0)

166****9220 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档