网站大量收购独家精品文档,联系QQ:2885784924

图数据库中的子查询算法研.pdf

  1. 1、本文档共177页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图数据库中的子查询算法研

摘 要 图是计算机科学中的重要数据结构。随着信息技术地不断发展 ,出现 了越来 越多的以图作为逻辑表达 的数据 ,例如化学分子结构式,生物网络 ,社会 网络 以 及 图像 中的实体关系等等。另一方面 ,这些 图数据本身 的数据量也在不断增大, 例如每天就有4,000个新的化学结构被加入到SCF Finder数据库 ;现在 的社会 网络 图中的结点数 目超过了1亿5千万。如何有效地管理和挖掘海量 的图数据是图数据 库研究的核心 问题。具体包括:1)如何建立有效的存储机制和索引策略;2 )如何 有效地回答 图数据库中的查询 ;3)如何从海量 的图数据库中挖掘 出有用 的信息。 子 图查询是 图数据管理 中的基本操作。具体地说 ,给定一个查询 图Q,在 图 数据库 中找到所有包含查询 图Q的数据 图。由于子 图同构是典型 的NP完全 问题 , 目前 的子 图查询算法均采用“过滤-精化” 的算法来找到结果集。在过滤阶段 ,根 据某种子 图同构 的必要条件过滤掉不可能包含查询 图Q的数据 图;然后在精化阶 段利用子 图同构算法在剩下的数据 图中找到结果集。目前 的大部分的过滤策略都 是基于“特征子结构” (简称“特征” )的方法。这种方法没有考虑到特征之 间的拓 扑关系。根据特征和特征之间的拓扑关系,设计一种新的过滤策略将加快子 图查 询 的响应时间。另外 目前 的子 图查询算法没有考虑数据库频繁动态更新 的情况。 当数据库 出现增删改时,不得不重新建立索引。为了适应动态 的图数据库 ,根据 图谱理论 ,将 图的拓扑信息映射到数据空间中;并根据映射 的数值空间,建立相 应 的索引结构。这种方法不但加快 了过滤 的时间,而且可 以动态 的维护索引结 构。 随着 社会 网络 等 复杂 网络 的 出现 ,给 定查询 图Q,如 何在 一 张 大 图中找 到Q的匹配位置是非常有意义的课题 ,例如可 以帮助我们找到社会 网络中的特定 的朋友圈,以及生物网络中的功能团。大 图上 的匹配的定义本身并一定是基于子 图同构。因为网络上考虑 的更多的是两点之 间的连接性关系。根据连接性关系, 找到查询 图Q的所有匹配位置。因为通常复杂 网络 中的节点数 目是海量 的,为了 I 减少搜索空间,将 图结构中映射到 向量空间。通过在 向量空间的操作,找到所有 的候选匹配位置 ;然后在原来 的图结构中确定最终的匹配结果集。 图数据挖掘可 以帮助我们从海量 的图数据 中找到有用 的知识 ,其中频繁结构 模式挖掘和结构相关性挖掘是两个重要 的课题。目前 的结构模式挖掘算法大部 分采用“生成-检测” 的算法框架。这种方法 的缺点是“检测”阶段耗费大量时间。根 据 图数据 的特例“树数据” 的特点,采用模式增长 的方式设计频繁结构模式挖掘算 法 ,从而避免了检测阶段。给定一个查询 图Q,希望从图数据库中找到与Q具有高 度相关性的子结构。这个 问题 的难点在于海量 的搜索空间。为了加快算法响应时 间,根据模式增长 的策略,设计一种有效的过滤策略。 用 图结构来表 示 关 系型数据 库 中 的记 录之 间 的“控制”关 系,从而将 传 统 的Top-K查询 问题转换为 图结构 中的遍历 问题。与现有 的经典Top-K查询算法相 比,这种方法 的优点是其搜索空间较小。 关键词:图数据库 ,子 图匹配查询 ,频繁结构模式,Top-K查询 II Abstract As an important data structure in computer science, graph can be used to model many complex objects, such as social networks, compound structures and so on. Fur- thermore, the growing popularity of graph databases has generated interesting data man- agement problems, such as sub-graph search, frequent structural pattern mining and so on. For example, approximate 4000

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档