- 1、本文档共177页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图数据库中的子查询算法研
摘 要
图是计算机科学中的重要数据结构。随着信息技术地不断发展 ,出现 了越来
越多的以图作为逻辑表达 的数据 ,例如化学分子结构式,生物网络 ,社会 网络 以
及 图像 中的实体关系等等。另一方面 ,这些 图数据本身 的数据量也在不断增大,
例如每天就有4,000个新的化学结构被加入到SCF Finder数据库 ;现在 的社会 网络
图中的结点数 目超过了1亿5千万。如何有效地管理和挖掘海量 的图数据是图数据
库研究的核心 问题。具体包括:1)如何建立有效的存储机制和索引策略;2 )如何
有效地回答 图数据库中的查询 ;3)如何从海量 的图数据库中挖掘 出有用 的信息。
子 图查询是 图数据管理 中的基本操作。具体地说 ,给定一个查询 图Q,在 图
数据库 中找到所有包含查询 图Q的数据 图。由于子 图同构是典型 的NP完全 问题 ,
目前 的子 图查询算法均采用“过滤-精化” 的算法来找到结果集。在过滤阶段 ,根
据某种子 图同构 的必要条件过滤掉不可能包含查询 图Q的数据 图;然后在精化阶
段利用子 图同构算法在剩下的数据 图中找到结果集。目前 的大部分的过滤策略都
是基于“特征子结构” (简称“特征” )的方法。这种方法没有考虑到特征之 间的拓
扑关系。根据特征和特征之间的拓扑关系,设计一种新的过滤策略将加快子 图查
询 的响应时间。另外 目前 的子 图查询算法没有考虑数据库频繁动态更新 的情况。
当数据库 出现增删改时,不得不重新建立索引。为了适应动态 的图数据库 ,根据
图谱理论 ,将 图的拓扑信息映射到数据空间中;并根据映射 的数值空间,建立相
应 的索引结构。这种方法不但加快 了过滤 的时间,而且可 以动态 的维护索引结
构。
随着 社会 网络 等 复杂 网络 的 出现 ,给 定查询 图Q,如 何在 一 张 大 图中找
到Q的匹配位置是非常有意义的课题 ,例如可 以帮助我们找到社会 网络中的特定
的朋友圈,以及生物网络中的功能团。大 图上 的匹配的定义本身并一定是基于子
图同构。因为网络上考虑 的更多的是两点之 间的连接性关系。根据连接性关系,
找到查询 图Q的所有匹配位置。因为通常复杂 网络 中的节点数 目是海量 的,为了
I
减少搜索空间,将 图结构中映射到 向量空间。通过在 向量空间的操作,找到所有
的候选匹配位置 ;然后在原来 的图结构中确定最终的匹配结果集。
图数据挖掘可 以帮助我们从海量 的图数据 中找到有用 的知识 ,其中频繁结构
模式挖掘和结构相关性挖掘是两个重要 的课题。目前 的结构模式挖掘算法大部
分采用“生成-检测” 的算法框架。这种方法 的缺点是“检测”阶段耗费大量时间。根
据 图数据 的特例“树数据” 的特点,采用模式增长 的方式设计频繁结构模式挖掘算
法 ,从而避免了检测阶段。给定一个查询 图Q,希望从图数据库中找到与Q具有高
度相关性的子结构。这个 问题 的难点在于海量 的搜索空间。为了加快算法响应时
间,根据模式增长 的策略,设计一种有效的过滤策略。
用 图结构来表 示 关 系型数据 库 中 的记 录之 间 的“控制”关 系,从而将 传 统
的Top-K查询 问题转换为 图结构 中的遍历 问题。与现有 的经典Top-K查询算法相
比,这种方法 的优点是其搜索空间较小。
关键词:图数据库 ,子 图匹配查询 ,频繁结构模式,Top-K查询
II
Abstract
As an important data structure in computer science, graph can be used to model
many complex objects, such as social networks, compound structures and so on. Fur-
thermore, the growing popularity of graph databases has generated interesting data man-
agement problems, such as sub-graph search, frequent structural pattern mining and so
on. For example, approximate 4000
您可能关注的文档
- 三维地形动态多辨率建模与关键算法的研究.pdf
- 三维场景建模关技术研究.pdf
- 三维地震数据断检测方法研究.pdf
- 人体脉象建模及诊仿真研究.pdf
- 人体运动捕获数的分割算法研究.pdf
- 人脸检测及瞳孔位的研究.pdf
- 协同过滤算法中型相似度计算方法的研究.pdf
- 像素位置与像素双重置换的混沌加密研究.pdf
- 双目立体视觉匹算法研究.pdf
- 人脸识别中光照变量提取算法研究.pdf
- 2024-2025学年人教版小学数学四年级下册教学计划及进度表.docx
- 2024-2025学年北师大版小学数学二年级下册教学计划及进度表.docx
- 2024-2025学年人教版小学数学五年级下册教学计划及进度表.docx
- 2024-2025学年人教大同版(2024)小学英语三年级下册教学计划.docx
- 2024-2025学年人教精通版(三起)(2024)小学英语三年级下册教学计划.docx
- 2024-2025学年统编版初中道德与法治八年级下册教学计划及进度表.docx
- 2024-2025学年统编版(2024)初中道德与法治七年级下册教学计划及进度表.docx
- 2023-2024学年上海黄埔区中考二模综合测试(物理部分)试卷及答案.pdf
- 2024-2025学年外研版(三起)(2024)小学英语三年级下册教学计划及进度表.docx
- 2025届北京市北京第四中学高三冲刺模拟数学试卷含解析.doc
文档评论(0)